





概率论基础教程 

A First Course in Probability 


“这是一本优秀的芈论基础教材.是我所見到最好的一本. • 

—— Nhu Nguyen (新墨西哥相立大学> 

••例子是如此地+富和实用，写作风格清新.洗杨.解答详*»、准确.是一本很好读的教材……” 

— Robert Bauer (伊利诺伊大学厄 巴钠- 尚佩思 分校） 


概率论作为数学的一个重要分支.在众多领域发挥着 越来越 突出的作用.本书是全球高校采用率最离 
的概率论教材之一，初版于1976年，多年来不断重印修订，是作者几十年教学和研究经验的 结晶。 

本书叙述淸晰.例子丰富，特別针对学生的兴趣选取了内容，有助于学生建立概韦直觉。第8版与时 
俱进.增加了很多新的习題和例子.并新增两节内容，分别推导具有均匀分布和几何分布的随机变量和的 
分布_本书还附有大量习 «. 理论习鼉和自检习鼉.其中自检习鼉部分还给出全部解答，有利于读者巩固 
和自簡所学知识. 


Sheldon M. Ross 国际知名槪率与统计学家.南加州大学工业工程与运筹系系主任.1%8年博士 
毕业于斯坦福大学统计系.曾在加州大学伯克利分校任教多年.研究领域 包括： 随机模型.仿真模拟. 
统计分析.金融数学等. Ross 教授著述頦丰，他的多种杨销数学和统计教材均产生了世界性的影响，其 
中 Simulation («统计模拟 》)、 Inlroduclion lo Probability Aforft* (« 应用随机 过程：概韦楢 型导论等均 
由人民邮电出版社引进出版. 
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Karlin. Taylor 《随机 过程初级教程(第 2 版 )》. 中文版和英文版 
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译者序 


概率论是研究自然界和人类社会中随机现象数量规律的数学分支.概率论的 
理论和方法与数学的其他分支、自然科学、工程、人文及社会科学各领域相互交叉 
渗透，己经成为这些学科中的基本方法.概率论（或概率统计）和髙等数学一样己 
经成为我国髙等院校各专业普遍设立的一门基础课. 

目前，这方面的教材已经很多，但这本由 Sheldon M . Ross 编写的《概率论基 
础教程》确实是一本很有特点的好教材.如在介绍概率的概念时，作者还用流畅的 
笔调介绍了这些概念的发展历史，从独立重复试验事件发生频率的极限到近代概率 
论的公理，同时引用大量例子介绍如何利用概率的公理进行概率的计算.这种讲法， 
使得即使是只具有初等微积分知识的读者，也会获益匪浅，对概率的概念有一个正 
确和深刻的认识.在介绍数学期望的概念时，作者用大 ft 的例子，强调应用期望的 
性质，特别是利用可加性进行期望计算，从而使读者加深了对期望的认识，也提高 
了运算技巧.从本书第1章到第8章，讲授的主题着重于概率论最基本的概念，如 
概率、条件概率、期望、大数定律和中心极限定理等.本书附有大量的有意义的练 
习，分为习题、理论习题和自检习题三大类，其中自检习题部分还给出全部解答，以 
供参考.从以上分析看出，本书完全实现了作者在前言中所提的 目标一试 图成 
为概率论的入门书. 

本书第1版出版于1976年，1981年在国内曾出过第1版的中文翻译版.此书 
经过作者历次修改，内容大大扩充.我们曾于2006年将原文第7版翻译成中文，由 
人民邮电出版社出版.此次，作者又在第7版的基础上加以修订，写成第8版.第 
8版语言更加精炼，并仔细斟酌了其中的例子.因此，本书是经过锥炼的优秀教材. 
此外作者的另一本著作 《随 机过程已经成为国内概率统计界推崇的教材.我们 
相信本教材也一定会受到国内各界的欢迎. 

由于译者的学识和中英文水平有限，译文难免会有不妥之处，欢迎广大读者批 


2009年11月 


①中 S 统计出版社， 2005. ——编者注 



前 言 


法国著名数学家和天文学家拉普拉斯侯爵（人称“法国的牛顿”）曾经说过 :“我 
们发现概率论其实就是将常识问题归结为计算.它使我们能够精确地评价凭某种直 
观感受到的、往往又不能解释清楚的见解……值得注意的是,概率论这门起源于机 
会游戏的科学,早就应该成为人类知识中最重要的组成部分……生活中那些最重要 
的问题绝大部分恰恰是概率论问题.”尽管许多人认为，这位对概率论的发展作出 
过重大贡献的著名侯爵说话有点过头，然而今日，概率论已经成为几乎所有的科学 
工作者、工程师、医务人员、法律工作者以及企业家们手中的基本工具，这是一个 
不争的事实.事实上，现代人们不 再问： “是这样吗？ ”而 是问： “这件亊发生的概率 
有多大？” 

本书试图成为概率论的入 门书. 读者对象是数学、统计、工程和其他专业（包 
括计算机科学、生物学、社会科学和管理科学）的 学生. 他们的先修知识只是初等 
微积分.本书试图介绍概率论的数学理论，同时通过大量例子说明这门学科的广泛 
的应用. 

第1章介绍了组合分析的基本原理，它是计算概率的最有效的工具 • 

第2章介绍了概率论的公理体系，并且指出如何应用这些公理进行概率计算. 

第3章讨论概率论中极为重要的概念，即事件的条件概率和事件间的独立性 • 
通过-系列例子说明，当部分信息可利用时，条件概率就会发挥它的作用；即使在 
没有这部分信息时，条件概率也可以使概率的计算变得容易、可行.利用“条件”计 
算概率这一极为重要的技巧还将出现在第7章，在那里我们用它来计算期望 • 

在第4 〜 6章，我们引进随机变景的概念.第 4 章讨论离散随机变量，第5章讨 
论连续随机变童，而将随机变量的联合分布放在第6章.在第 4 章和第5章中讨论 
了随机变量的期望和方差，并且对许多常见的随机变量，求出了相应的期望和方差 • 

第7章讨论了期望值和它的一些重要的 性质. 书中引入了许多例子，解释如何 
利用随机变量和的期望等于随机变量期望的和这一重要规律来计算随机变景的期 
望，本章中还有几节介绍条件期望（包括它在预测方面的应用）和矩母函数等.最 
后一节介绍了多元正态分布，同时给出了来自正态总体的样本均值和样本方差的联 
合分布的简单 证明. 

第8章介绍了概率论主要的理论结果.特别地，我们证明了强大数定律和中心 
极限定理.关于强大数定律的证明，我们假定随机变量具有有限的四阶矩.在这种 
假定之下，证明十分 简单. 在中心极限定理的证明中，我们假定了莱维连续性定理 
成立.在本章中，我们还介绍了若干概率不等式，如马尔可夫不等式、切比雪夫不 
等式和切尔诺 夫界. 在最后一节，我们给出用随机变量的相应概率去近似独立伯努 





利随机变量和的相关概率的误差界. 

第 9 章介绍了一些附加主題，如马尔可夫链、泊松过程以及信息编码理论初 
步.第10章介绍了统计模拟. 

与前几版一样，每章后面附了三组练习题，分别命名为习题、理论习题和自检 
习頭.在附录 B 中提供了自检习題的全部解答®，以供学生检验他们的理解能力. 

新版中的新增或改变部分 

第8版继续对原有教材作了微调和改进.从培养学生的直观能力和学习兴趣 
出发，新版增添了一些例子和习题.例如，在第1章例 5 d 讨论了淘汰赛问题，在第 
7章例 4 k 和例 5 i 讨论多人博奕的破产问题. 

这一版的一个重要的改变是将“随机变童和的期望等于各随机变量期望的和” 
这一重要结论由原来（第7版）的第7章挪到第4章.新版中为这个结论提供了新 
的初等证明（有限样本空间的情况). 

另一个改变是扩充了原 6.3 节的内容. 6.3.1 节是全新的内容.在这一节中，我 
们导出独立同分布的均匀随机变®的和的分布.并且利用这个结果导出了这样的结 
果： 随机变量部分和超过 1 所需的项数的期望值为 e. 6.3.5 节也是新的.这一节讨 
论一组独立几何随机变童的和的分布问题，此处各随机变 ft 参数 Pi 可以是不同的 
值.这一节中导出了这个和的分布. 
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第 1 章组合分析 

1.1 引言 

首先,我们提出一个与概率论有关的有趣的经典 问题： 一个通信系统含 n 个天 
线，顺序地排成一排，只要没有两个连续的天线都失效，那么这个系统就可以接收 
到信号，此时称这个通信系统是有效的.已经探明这 n 个天线里,恰好有 m 个天线 
是失效的，问此通信系统仍然有效的概率是多大？举例来说，设 n = 4 ，m = 2,通信 
系统是否有效取决于这 n 个天线的设置方式（它们的排列次序).这4个天线一共 
有6种可能的设置方式 

0 1 1 0 0 1 0 1 1 0 1 0 0 0 1 1 1 0 0 1 1 1 0 0 
其中，1表示天线有效，0表示天线失效.可以看出前3种情况下整个通信系统仍 
然有效,而后3种情况下系统将失效，因此，若天线的设置方式是随机排列的,所求 

的概率应该是 ^ = 1. 对于一般的 n 和 m 来说，用类述方法可以计算出所求 
概率.即先计算使得系统仍有效的设置方式有多少种，再计算总共有多少种设置方 
式，两者相除即为所求概率. 

从上所述可看出，一个有效地计算事件发生结果数目的方法是非常有用的.事 
实上，概率论里的很多问题只要通过计算一个事件发生结果的数目就能得以解决. 
关于计数的数学理论通常称为组 合分析 (combinatorial analysis ). 


1.2 计数基本法则 

对我们的整个讨论来说，以下关于计数的法则是基本的.粗浅地说，若一个试 
验有 m 个可能结果， 另一个 试验有 n 个可能结果，则两个试验一共有 mn 个结果. 

计数基本法则 

有两个试验,其中试验1有 m 种可能发生的结果，对应于试验1的每 
—个结果，试验2有 n 种可能发生的结果，则对这两个试验来说，一共有 

mn 种可能结果. _ 

基本法则的证明通过列举两个试验所有可能的结果来证明这个问题，结果 
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( m , l ) ( m ，2) … ( m , n ) 

其中， （ i ， j ) 表示第一个试验结果是第 i 种、第二个试验结果是第 j 种.因此,所有 
可能结果组成一个矩阵,共有 r « 行 n 列，结果的总数为 mxn , 这样就完成了证明. 

例 2 a —个小团体由10位妇女组成,每位妇女又有3个孩子.现在要从其中 
选取一位妇女和她的一个孩子评为“年度母亲和年度儿童”，问一共有多少种可能 
的选取方式？ 

解： 将选择妇女看成第一个试验，而接下来选择这位母亲的一个孩子看作第二 
个试验，那么根据计数基本法则可知，一共有10 x 3 = 30种选择方式. ■ 

当有2个以上的试验时，基本法则可以推广如下. 

推广的计数基本法则 ~ 

一共有 r 个试验.第一个试验有 m 种可能 结果; 对应于第' "•个试验的 
每•种试验结果，第二个试验有 rt 2 种可能 结果; 对应于头两个试验的每一 
种试验结果，第三个试验有 n 3 种可能 结果；等等. 那么，这 r 个试验一共 

有 n ! Ti 2-- n r 种可能结果. __ 

例 2 b —个大学计划委员会由3名新生、 4 名二年级学生、5名三年级学生、2 
名毕业班学生组成.现在要从中选 4 个人组成一个分委员会，并要求分委员会的成 
员来自不同的年级，一共有多少种选择方式？ 

解： 可以把它理解为从每个年级选取一个代表，从而有 4 个试验，根据推广的 
计数基本法则，一共有 3 x 4 x 5 x 2 = 120 种可能的选择结果. ■ 

例 2 c 车牌号是7位的，如果要求前3个位置必须是字母，后 4 个必须是数 
字,一共有多少种编排车牌号的方式？ 

解： 根据推广的计数基本法则，可知道答 案为： 26x26x26x10x10x10x10 = 

175 760 000. ■ 

例 2 d 对于只定义在 n 个点上的函数，如果函数取值只能为0或1，这样的 
函数有多少？ 

解：设 这 n 个点为 , n , 既然对每个点来说， /( i ) 的取值只能为0或者 
1,那么一共有 2 n 个这样的 函数. ■ 

例 2 e 在例 2 c 中，如果不允许字母或数字重复,一共有多少种可能的车牌号? 

解：这种情况下，一共有26 x 25 x 24 x 10 x 9 x 8 x 7 = 78 624 000种可能的 

车 牌号. ■ 


n n 
( 1 ,( 2 , 


2 ), 2 ) 
(!,( 2 , 

( 1 ,( 2 , 
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1.3 排列 

按随意顺序来排列字母 a,b,c, 一共有多少种排列方式？通过直接列举，可知 
一共有 6 种： abc,acb,bac,bca,cab 以及 cfta. 每 ~ ■种都可以称为一个排列 (permuta¬ 
tion). 因此， 3 个元素一共有 6 种可能排列方式.这个结果能通过推广的计数基本法 
则 得到： 在排列中第一个位置可供选择的元素有 3 个，第二个位置可供选择的元素 
是剩下的两个之一 , 第三个位置只能选择剩下的 1 个元素，因此一共有 3x2x1 = 6 
种可能的排列 . 

假设有 n 个元素，那么用上述类似的方法 , 可知一共有 n(n-l)(n-2) - -3-21 = 
n! 种不同的排列方式 . 

例 3a — 个垒球队一共有 9 名队员，问一共有多少种击球顺序？ 

解： 一共有 9! =362 880 种可能的击球顺序 . _ 

例 3b 某概率论班共有 6 名男生、 4 名女生 , 对班上的学生进行一次测验，并 
根据测验成绩排名次，假设没有两个学生成绩一样 . 

(a) — 共有多少种排名次的方式？ 

(b) 如限定男生、女生分开排名次，一共有多少种抹名次的方式？ 

解： 

(a) 每种排名方法都对应着一个 10 人的排列方式 , 故答 案是： 10! =3 628 800. 

(b) 男生一起排名次有 6! 种可能，女生一起排名次有 4! 种，根据计数基本法 

则，一共有 6! X4! =720x24 = 17 280 种可能结果 . ■ 

例 3c 把 10 本书放到书架上，其中有 4 本数学书、 3 本化学书、 2 本历史书 
和 1 本语文书 . 现在要求相同类别的书必须紧挨着放，问一共有多少种放法？ 

解： 如果数学书放在最前面，接下来放化学书，再下来放历史书，最后放语文 
书，那么一共有 4!3!2!1! 种排列方式 _ 而这 4 种书的顺序一共又是 4! 种，因此， 
所求答案是 4!4!3!2!1! =6912. ■ 

接下来讨论如果有 n 个元素，其中有些是不可区分的，这种排列数如何计算？ 
先看下面的例子 . 

例 3d 用 PEPPER 的 6 个字母进行排列，一共有几种不同的排列方式？ 

解：如果 3 个字母 P 和 2 个字母 E 都是可以区分的（标上号 ) ，即 Pi&PjjPaEsiR ， 
一共有 6! 种排列方式 . 然而，考察其中任一个排列，比如 PiP 2 EiP 3 E 2 R , 如果分别 
将 3 个字母 P 和 2 个字母 E 的次序重排，那么得到的结果仍然是 PPEPER , 也就 
是说，总共有 3!2 !种排列 

PiP 2 EiP 3 E2 R PiP 2 E 2 P 3 EiR P 1 P 3 E 1 P 2 E 2 R PiP 3 E 2 P 2 EiR 
P 2P1E1P3E2R P2P1E2P3E1R P2P3E1P1E2R P2P3E2P1E1R 
P3P1E1P2E2R P3P1E2P2E1R P3P2E1P1E2R P3P2E2P1E1R 
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这些排列都具有 形式： PPEPER . 因此一共有6!/(3!2!)=60种不同的排列方式. ■ 
一般来说，利用上述同样的推论方法 可知： n 个元素，如果其中 m 个元素 
彼此不可区分，另 n 2 个彼此不可区分， •••, n r 个也彼此不可区分，那么一共有 

— T -^ —— f 种排列方式. 

fll ! 7»2 ! • • • n r ： 

例 3 e —个棋类比赛一共有10个选手,其中4个来自俄罗斯，3个来自美国, 
2个来自英国，另1个来自巴西.如果比赛结果只记录选手的国籍，那么一共有多 
少种可能结果？ 

解：一共有= 12 600 种可能结果. ■ 

例 3 f 有9面小旗排列在一条直线上，其中4面白色、3面红色和2面蓝色， 
颜色相同的旗是一样的.如果不同的排列方式代表不同的信号，那么一共有多少种 
可能的信号？ 

解：—共有 jt!W = 1260 种不同的信号. ■ 

1.4 组合 


从 n 个元素当中取 r •个，一共有多少种取法？这也是一个有趣的问题.比如， 
从 A , B , C , D 和 E 这5个元素中选取3个组成一组，一共有多少种取法？解答如 
下： 取第一个有5种取法，取第2个有4种取法,取第三个有3种取法，所以，如果 
考虑选择顺序的话，那么一共有 5 x 4 x 3 种取法.但是，每一个包含3个元素的组 
( 比如包含 A , B , C 的组）都被计算了 6次，（也即，如果考虑顺序的话,所有的排列 
ABC , ACB , BAC , BCA , CAB , CBA 都被算了一次 .） 所以，组成方法数为： 


一般来说，如果考虑顺序的话，从 n 个元素中选择 r 个组成一组一共有 n ( n - 
l)... (n _ r + l ) 种方式,而每个含 r 个元素的小组都被重复计算了共 H 次.所以, 


能组成不同的组的数 目为： 


n(n - 1) • • • (n — r + 1)_ w ! 

r ! — (n - r )! r ! 


I 记号与术语 

对 r < n ， 定义 如下： 

\ r / (n — r )! r ! 

I 并且说表示了从 n 个元素中一次取 r 个的可能组合数 . a 


①为了方便,0!被定义为1,因此， (2) = (")=!. 当 i <0 或者 i > n 时，有时也认为等于 0. 




因此，就表示了从 n 个元素中一次取 r 个元素的可能取法的数目，如果不 
考虑抽取顺序的话. 

例 4 a 从20人当中选择3人组成委员会 ，一 共有多少种选法？ 

解： —共有⑺= ' HY 8 = 1140种选法. ■ 

例 4 b 有个12人组成的团体,其中5位女士，7位男士，现从中选取2位女 
士, 3位男士组成一个委员会，问有多少种取法？另外,如果其中有2位男士之间有 
矛盾，并且坚决拒绝一起工作，那又有多少种取法？ 

解：有 种方法选取女士，有种方法选取男士，根据基本计数法则一 

共有® (D - S 咖种方式选取2位女士 3 位 男士. 

现在来看如果有两位男士拒绝一起工作，那么选取3位男士的= 35种方 
法中，有 © © = 5 种同时包含了该两位男士，所以，一共有35 - 5 = 30种选取 

方法不同时包含那两位有矛盾的 男士； 另外，选取女士的方法仍是= 10种，所 
以，一共有30 x 10 = 300种选取方式. ■ 

例 4 c 假设一排71个天线中，有 m 个是失效的，另 n - m 个是有效的，并且 
假设所有有效的天线之间不可区分，同样，所有失效的天线之间也不可区分.问有 
多少种排列方式,使得没有两个连续的天线是失效的？ 

解： 先将 n - m 个有效天线排成 一排， 既然没有连续两个失效的,那么两个有 
效天线之间，必然至多放置一个失效的.也即，在 n - m +1 个可能位置中（如图 1.1 
中的星号)，选择 m 个来放置失效天线.因此有 ( n ~^ +1 ) 种可能方式确保在两 
个失效天线之间至少存在一个有效天线 .® ■ 

以下是一个非常有用的组合恒 等式： 

o = e ： j ) + ( n ； 1 ) ⑽ 

上述恒等式可用分析的方法证明，也可从组合的角度来证明.设想从 n 个元素中取 
r •个,一共有种取法.从另一个角度来考虑，不妨设这 n 个元素里有一个特殊 
的，记为元素1,那么取 r 个元素就有两种结果，取元素1或者不取元素 1. 取元素 

①若 m > n-m + l , 按组合记号的约定， ( n- ^ + 1 ) = 0. 这也符合实际，当失效天线太多的时 
候，任何天线的次序捭列，总有两个相邻的天线是失效的. 


译者注 
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1 的方法一共有£?二^种（从 n - 1个元素里面取 r - 1 个)； 不取元素1的方法 

—共有广^种（从去掉元素1的剩下 n - 1个元素中取》•个) . 两者之和就是从 
n 个元素里取 r 个的方法之和，所以恒等式成立. 

1：有效天蜮 
-： 放最多一个失效天线 


图 1.1 天线的样列 

值经常也称为二項式系数 (binomial coefficient ), 这是因为它们是以下的 
二项式定理中重要的系数. 


二项式定理 

(*+ y) n = E(fc) a： v- fc 

(4.2) 


fc =0 



以下提供二项式定理的两个证明方法，其一是数学归纳法，其二是基于组合考 
虑的证明. 

二项式定理的归纳法证明 n = 1时， (4.2) 式 化为; r+y = QxV + Q)* 1 !/ 0 = 
y + x . 现假设 (4.2) 式对于 n - 1 成立,那么对于 n, 

n— 1 

(* + y) n = (x + y)(x + y ) n ~ 1 = (x + y) E ( n [ 9 工 V- 1 -* 
fc =0 

= E( n * >*+ v - h +x：( n fc 

fc =0 fc =0 

在前面的求和公式里令 i = k + l , 后面的求和公式里令 i = fc, 那么 

(-+#= E (:: + E (" 7 

t=l «=o 

-"+e[G ： i 1 ) + ("7 1 )]^- ,+ »" 

=x- + E +« n =E G)^ 

t=l »=0 

这样就证明了等式. H 

二项式定理的组合法证明考虑乘积（:^ + yi)(x 2 + y 2 )---(x n + p n ) 展开后一 
共包含 2" 项，每一项都是 n 个因子的乘积，而且每一项都包含因子 A 或 yi， 例如： 





1-5 多项式系數 7 


(*1 + yi)(xt + Vi ) = X \ X2 + Xiy 2 + VlX 2 + 1/11/2 

这 2 n 项和里面，一共有多少项含有 fc 个和 n - fc 个讲？ 

含有 fc 个 ** 和 n - fc 个的每一项对应了从 n 个元素 x u x 2 , … ， a :„ 里取 fc 
个元素的 取法. 因此一共有个这样 的项. 这样，令 au = = V ，i = 1，... ， n , 
可以看出 n 

(x + l/) n = E(")*V- fc ■ 

k =0 

例 4 d 展开 （ a : + y ) 3 . 

解： ㈣ ) 3 = ( o ) lV + ⑦ 々 + ® A + ® 々 

= I / 3 + 3 xy 2 + 3 x 2 y + x 3 ■ 

例 4 e —个有 rt 个元素的集合共有多少子集？ 

解： 含有 ife 个元素的子集一共有个，因此所求答案为 

E 0 = (1 + 1)" = 2 n . 

fc =0 

该结果还可以这样 得到： 给该集合里的每个元索都标上1或0,每种标法都一 
一对应了一个子集,例如，当把所有元素都标为1时候，就对应着一个含有所有元 
素的子集.因为一共有 2" 种标法,所以一共有 2" 个子集. 

上述结论包含了一个元素都没有的子集（也即空集)，所以至少有一个元素的 
子集一共有 2 n _ 1个. _ 


1.5 多项式系数 


本节考虑如下问 题：有 n 个不同的元素,分成 r 组，每组分别有 nx . na , 


个元素，其中 = —共有多少种分法？注意到，第一组成员有种选 
取方法，接下来，选定第一组成员后，选第二组成员时只能从剩下的 n - m 个元素 
中选，一共有 ( n ； 2 ni ) 种取法，接下来第三组有("'^ 3 '" 2 )种取法， 等等因 
此,根据推广的计数基本法则，将 n 个元素分成 r 组的分法总数一共是 


( n.r 


n! _ (n — ni )! 

(n — ni)^!nj ! (n _ ni - 勿 ) ! 

«i! «2! • • • n r ! 



(jl — Til — n2 — — Hr_l) ! 

0!«r! 
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用另一个方法也可以得到此结 果：有 n 个球，其中 m 个标有记号1, n 2 个标 

有记号2, •••,«,. 个标有记号 r . 具有相同标号的球之间是不可分辨的.现在设有 

n 个对象，记为1，2, • • •， n . 设想一个球里也只可放一个对象.把 n 个对象放到 r 个 

球里边,等价于将 n 个对象分成 r 个组，因为每个球有一个标号，这个标号就是这 

个对象的组号.现在问一共有多少不同的分组方式呢？先把这些对象排成一个固定 

的顺序，然后将这些球进行排列.当球的排列确定以后，每一个对象就对应一个球 

的编号.这就等价于将 n 个对象分成 r 个组，每个对象的组号就是这个对象所对应 

的球号.这些排列数就是这 n 个对象的分组数.在 1.3 节里讨论了 n 个对象的排列 

数的计数方法，其中具有相同球号的球之间是不可分辨的.在这种情况下， n 个球 

的排列数为 ■■ 

nj ! ••• n r ! 


记号 

如果叫+叱+…+〜…定义 J 为 
(ni,na, ■ - • ,Tir) ni!na !•••〜！ 

因此 ，f n ) 表示了把 《 个不同的元素分成大小分别为 
ni ， r»2, … ,n r 的 r 组的方法__ 


例 5 a 某小城市的蒈察局有10名警察，其中需要 5 名警察在街道巡逻， 2 名 
警察在局里值班，另3名留在局里待命.问把10名警察分成这样的3组共有多少 
种不同分法？ 

解： 一共有 10!/(5!2!3!) = 2520种分法. ■ 

例 5 b 10个小孩要分成 A ， B 两队，每队5人 . A 队去参加一场比赛， B 队则 
去参加另一场比赛,一共有多少种分法？ 

解： 一共有10!/(5!5!) = 252种分法. ■ 

例 5 c 10个孩子分成两组，每组 5 人进行篮球比赛，一共有多少种分法？ 

解： 这个问题与例 5 b 不同的是，分成的两组是不用考虑顺 序的. 也就是说，这 
儿没有 A ， B 两组之分，仅仅分成各自为5人的两组，故所求答案为 

101/(515!) =126 ■ 

2 ! 


下面的定理是二项式定理的推广，其证明留作习题. 


①为了表达方便，今后将 r> 个不同元索分成大小不同的称为“多项组合”，分组的方法数 
—译者注 
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多项式定理 



(*1 + 12 + • • • + X r ) n = 




ni+ … +*»«•=»» 

上式的求和号是对一切满足 rn + 712 + ■■■ + n r 

= n 的所有非负整向童 

(ni,ri2, …， nr) 求和. 




鉴于多项式定理的形式，多项组合数 ( ni>n2) n .. inr ) 也称 为多项式系數 
(multinomial coefficient ). 

例 5 d 考虑涉及 n = 2 m 个人的淘 汰赛. 将这 n 个参赛者随机地分成|对， 
并且让每一对选手进行比赛，比赛的贏者留下来，进入下一轮的比赛，而失畋者则 
淘汰出局.这样,一轮一轮比赛下去,直到最后一个得胜者，成为 冠军. （假设洵汰赛 
中一共有8个参赛者 .） 

( a ) 在第一轮比赛中，有多少不同的可能结果？（例 如： 其中一个结果为1战胜 
2, 3战胜4, 5战胜6, 7战胜 8.) 

( b ) 在整个淘汰赛中，一共有多少种不同的结果，其中每一个结果展示了各轮 
比赛的全部信息. 

解 ：可以 通过确定第一轮比赛的可能分组方法数来确定第一轮比赛的可能结果 
数.注意到，将8个参赛者分成第一对、第二对、第三对、第四对，共有 ( 2 2 ® 2 2 ) = 

种分法.因此，当不考虑这4对的先后顺序时，可能的分组方法数是^.对于 

& 0104 

每一种分组方法中的每一对选有两种比赛结果,这表明第一轮比赛中一共有= 
^ 种可能的结果 ® 

①为了具体化，我们将潸汰赛理解为由8个选手组成的乒乓球淘汰赛.假定第一轮比赛中一共有4 
张桌子，并引入几个概念.将8名运动员分配到4张乒乓桌进行比赛，每种分 K 方案称为一个“分 
配”，例如 [(1,2), (3,4), (5,6), (7,8)] 表示一个分配，将1号和 2 号运动员分配在第1桌，…，将 
7号和8号运动员分配在第4桌.分配方案数就是多项组合数 ( 2 2 ® 2 2 ) = |[-我们引入的第 
二个概念《是“分组”.将1号和2号运动员分在一个粗进行比赛， ... /将7号和8号运动员分在 
一组进行比赛，而不管这些运动员的比赛是在*一张桌子进行的，例如 [(1,2), (3,4), (5,6), (7,8)] 
与 [(3,4), (1,2), (5,6), (7,8)] 是不同的分配，但从分组的角度#,两者没有区别，属于同一个分组 
方案.分配方案数与分组方案数之间具有如下关系： 

分配方案数=分组方案数X 41 

因此，在第一轮比赛中一共有种不同的分组方法.对于每一种分组方法中的毎—对选手有两 
种比赛结果.这样，每一种分组方法一共有0种不同的比赛结果.利用计数基本法则可知，在第— 
轮比赛中一共有^ | 种可能结果. 
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1也可用另一种看法来理解这个结 果：在 8个选手中有4个得胜者.这种得胜 
者的组合数为每一个得胜者组合（例如， (1,2, 3, 4) 为得胜者之组合）可有4! 

种不同的方式与4个失败者进行比赛,这样在第一轮比赛中，一共有4!(®) = | 个 
可能的比赛结果 .1 ( 

类似地，对于第一轮比赛的每一个可能结果，其第二轮比赛的可能结果数为 I . 

对于前面两轮比赛的每一种可能结果，在第三轮比赛的结果数为 I . 利用推广的计 
数基本法则可知，整个洵汰赛的所有可能的结果数为 =8!. 类似的推论可 
知，在 n = 个参赛者组成的淘汰赛中，一共有 n ! 种可能的比赛结果. 

知道了上面的结论，我们很容易将淘汰赛的各种可能结果与 （1,2, . . .， n ) 的各 
种排列之间建立一一对应关系.对每一个比赛的可能结果，给参加比赛者一个排名. 
比赛的冠军排名为1,在最后决赛时,输给冠军的人排名为 2. 在倒数第二轮中的两 
位输者的排名 如下： 与冠军比赛者的排名为3,与亚军比赛者排名为 4. 这样，在倒 
数第三轮比赛中4名胜利者己经排出1，2, 3, 4的名次.这轮比赛中 4 名失败者排 
名为5, 6, 7, 8.与第1名比赛者排名5,依次下去，与第4名比赛者排名 8. 这样 
继续排下去,直到所有参赛者都得到排名.（可以用更简洁的方式描述这种名次.淘 
汰赛的最后得胜者排名为1，其余的参赛者的名次是这样确定的：参赛者被打败的 
那一-轮中的比赛场次 2 fc , 再加上打畋他的那个人的名次 ， fc = 0,1,2 ,…， m - 1.) 这 
样,洵汰赛的结果可用排列来表示，其中 b 代表第 j 名参赛者的编号. 
由于不同的淘汰赛的结果给出不同的排列，而对于每一个排列，都有一个洵汰赛的 
结果与之对应.这样,可能的淘汰赛的结果数目与 I ," ^的排列数相同，即 "!. ■ 
例 5 e 

(xi + x 2 + x 3 ) 2 = ( 2 ,5,0) Z ^ + + 

+ ( 1 ，1。>碗 + ( 1 , 2 。>»卜(。1>幽 

= Xi+xl + xl + 2lll2 + 2lll3 + 2l2X3 ■ 

*1.6 方程的整数解个数 3 > 

把 n 个可分辨的球分到 r 个可分辨的坛子里，一共有 P 种方式.这是因为 
任一个球都有可能放到 r 个坛子中的任—个 • 现在假设这 n 个球是不可分辨的， 

①此处或以后打 * 号表示这些材料是可以选读的，或是选作的题目. 
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这种情况下一共有多少种可能结果呢？由于球是不可分辨的，将 n 个球分到 r •个 
坛子里的结果可以描述为向量 , x r ), 其中而表示分到第 i 个坛子里球 
的数量.因此，此问题也等同于求出满足 an + Z2 + ••• + & = n 的非负整数向 
量的个数.为了计算它，先考虑该方程的正整数解 个数： 设想有 n 
个不可分辨的球排成一排，现把它们分成 r 组，每组都不空.要做到这一点，我们 
可在 n 个球之间的 n - 1 个空隙里选取 - 1个（如图 1.2 所示).其证明留作 
习题. 


/I个对象0 
在-处选择 r-l 个 


图 1.2 «个球之间的 n - 1个空隙里选取 r - 1个 
例如, n = 8,r = 3 时,可以选两个就能隔开： 

ooo|ooo|oo 

代表向量 : d =3, x 2 = 3,13 = 2. 由于一共有(^~})种选择可能，因此就可以得 
到以下命题. 

命题 6.1 共有(^})个不同的具有正整数分纛的向量 { X U X 2 ,--- , X T ) 

满足 

Xi + X 2 + ■•■ + x r = n > 0,i = I,-- - ,r 

为了得到非负整数解（而不是正整数解）个数，注意到 XX + X2 + ■■■ + x r = n 
的非负整数解个数与 yi + V2 + - + y r = n + r 的正整数解个数是相同的（令 

y < = a：i + l,i = l , ••- , r ). 因此，利用命题 6 . 1 , 可得到如下命题. 

命题 6.2 共有个不同的具有非负整数分童的向量（町, 212 ,…， 

X r ) 满足 

XI + X2 + ■■•+ X r = n (6.1) 

例 6 a 方程 H +奶= 3 共有多少组不同的非负整数解？ 

解： 一共有（ 3 匕 ” =4 组解: (0,3), (1,2), (2,1), (3,0). ■ 
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例 6 b 有2万美元可投资到4个项目上，每份投资必须是1000美元的整数 
倍.如果要求2万美元全部投资，一共有多少种可行的投资方法？如果不要求将钱 
全部投资呢？ 

解 ：令叫 (*=1,2, 3, 4) 分别表示4个项目的投资额（单 位： 千美元)，因此，4 
个项目的投资额就是方程 XI + x 2 + x 3 + i 4 =20 x ^0 的非负整数解.根据命题 
6.2, 一共有( 2 3 3 ) = 1771种可能的投资方式.如果并不需要将钱全部投资，那么假 
设： c 5 表示剩余资金，那么一个投资策略就对应了如下方程的一个非负整 数解： 

®1 + 12 + *3 + *4 + *5 = 20 

因此,根据命题6.2,存在(^) = 10 626种投资策略. _ 

例 6 c 在 （: ci + a ：2 +…+ av )" 的展开式中，一共有多少项？ 

其中，求和针对所有满足 〜 + •..+〜 = « 的非负整数 （ TU ， ••- , nr ). 因此，根据命 
题6.2, 一共有 项. ■ 

例 6 d 再来讨论例 4 c , 有 n 个天线，其中 m 个是不可分辨的失效天线，另 
n - m 个也是不可分辨但却有效的.现在要求求出排成一排且没有连续两个失效天 
线的可能排列数.设想 m 个失效的天线排成一排，现找出放 n - m 个有效天线的 
位置.如果是排成了如下 方式： 

Il 0 X 20 - X m 0 x m+ l 

其中 : d > 0是放在最左边的有效天 线数； Xi >0 ,i = 2,--, m , 是放在第 i 个失效 
天线和第 i - 1个失效天线之间的有效天线的 个数; x m+1 > 0是放在最右边的有效 
天线数.这样的配置意味着任两个失效天线之间都至少有一个有效天线，因此，满 
足条件的可能数是下列方程向量解的 个数： 

ii + • • • + x m +i =n-m xi ^ 0, x m+ i > 0, > 0, i = 2, •■- ,m 

令 j/i = *i + 1, j/i = t = 2, • • • ,m, y m +i = x m +i + 1, 可以看出它等同于以下方 
程的正整数向量解 个数： 

yi + 1/2 + • • • + y m +i = n — m + 2 

由命题 6.1 知，一共有 ( n _ ^ +1 ) 种这样的配置方式，这与例 4 c 的结果一致. 

现在来考虑每两个失效天线之间至少有两个有效天线这种情况的排列数•根 
据上述同样的理由，结果为如下方程的解的 个数： 

XI + • • • + x m+ i = n-m Xi ^ 0, i m +i ^ 0, ^ 2, i = 2,• ■ • ,m 



令 yi = a：i +1, 1 /i = a:* — 1, < = 2, … ， m ， y m +i — ®m+i + 1> 可以看出它等同于以下 
方程的正整数向量解的 个数： 

I/i + • • • + l/m+i = n — 2m + 3 

因此，由命题 6 . 1 , 可知一共有(" _2 ^ + 2 )种配置方式. ■ 


小 结 


计数基本法则阐述了如下事实：如果一个试验分成两个阶段，第一个阶段有 n 
种可能结果，每种结果又对应于第二个阶段的 m 种可能结果，那么该试验一共有 
nm 种可能结果. 

n 个元素的排列一共有 n ! = n(n - 1)...3.2.1种可能排列 方式. 特别地， 


0 ! = 1 . 


(<) = (n-<)!iT 

其中 0 < i < n, 否则等于 0. 此式表明了从 n 个元索中选取 i 个元索的可能选取方 
法数，称为从 n 个对象中选取 i 个对象的组合数，因其在二项式定理中的突出 
地位,它也常称为二項式系数,我们有 

(:c + y) n = 亡⑺ 

i=0 


对于任意和为 n 的非负整数 ni , -- , nr , 



n ! 

ni ! Ji2 ! • • .n r ! 


它等于 n 个元素分成互不重叠的 r 部分，其中各个部分的元素个数分别是〜， 
n 2 ,--, n r 的分法数 • 


习 题 

1. ( a ) 前2位为字母而后5位为数字的汽车牌照一共多少种？ 

( b ) 在上述条件下，如果不允许宇母和数字重复，又有多少种？ 

2. 掷一枚敗子4次，一共有多少种结果？比如说，如果第一次为3,第二次为4,第三次为3, 
第四次为1，那么结果就是 “3,4,3,1” . 

3. 20种不同的工作分派给20个工人，每个工人一种工作，问有多少种分派方式？ 

4 . 约翰、吉姆、杰伊和杰克组成一个有4种乐器的乐队，如果每个人都会演奏这4种乐器， 
问可以有多少种不同的组合？如果约翰和吉姆会演奏这 4 种乐器,而杰伊和杰克分别只会 
弹钢琴及打鼓,那么又有多少种不同组合？ 
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5. —直以来，美国和加拿大的电话区号由3位数组成，第一位是2~9之间的任一 数字； 第 
二位是0或者1;第三位是1 〜 9之间的任一数字.问一共有多少种可能的区号？以4开 
头的区号一共有多少种可能？ 

0. 有个熟知的 童谣： 

我出发去圣-艾弗斯， 

路上碰见一个人， 

带着他的7个老婆， 

每个老婆挎着7个包， 

每个包里装着7只猫， 

每只猫生了 7只小猫咪， 

数数看，我到底看到了多少只小猫咪？ 

7 . ( a ) 3个男孩和3个女孩坐在一排，一共有几种坐法？ 

( b ) 如果男孩和女孩分别坐在一起，-•共有几种坐法？ 

( c ) 如果只要求男孩坐在•起，一共有几种坐法？ 

( d ) 如果相邻的座位上必须坐异性， 一 共有几种坐法？ 

8. 以下单词的字母可以有多少种排列方式？ 

( a ) Fluke ; ( b ) Propose ; ( c ) Mississippi ; ( d ) Arrange . 

9. 一个孩子有 12 块积木，其中6块黑色、4块红色、1块白色和1块 ffi 色.孩子想把这些积 
木排成一抹，一共有多少种抹法？ 

10. 8人坐在一排，一共有多少种坐法，如果 

( a ) 没什么 限制； （ b ) A 和 B 必须坐在 一起； （ c ) 一共4个男人，4个女人,且任何两个男人 
不能坐在•起，任何两个女人也不能坐在 一起； （ d ) 共有5个男人，且他们必须坐在 一起； 

( e ) 有4对夫妇，每对夫妇必须坐在一起. 

11. 把3本小说、2本败学书和1本化学书摆放到书柜里，一共有多少种摆放方法？如果 

( a ) 书可以以任何顺序 摆放； （ b ) 数学书必须放一起，小说必须放 -起； （ c ) 小说必须放一 
起，其他书无所谓. 

12. 某个班级有30名学生，有5个不同的奖项（成绩奖、组织奖等等）要颁发，一共有多少种 
不同的颁奖方式？如果 

( a ) 一个学生可以得多个 奖项； （ b ) 每个学生最多只能得1个奖项 • 

13. 有20个人，毎人都要与其他人握 次手， 一共要捶多少次手？ 

14. 从一副牌的52张中任意抽取5张，-共有多少种抽法？ 

15. 一个舞蹈班有22个学生，10女12男，要挑选5男5女然后配对，一共有多少种配法？ 

16. 某学生从6本数学书、7本科学书和4本经济学书里卖掉 2 本，有多少种选择？如果 
( a ) 两本书同一 科目； （ b ) 两本书不同科目. 

17. 共有7件不同的礼物分给10个孩子，如果每个孩子最多只能拿1件礼物，一共有多少种 
分法？ 

18. 有5名共和党人，6名民主党人和4名无党派人士，要从中分别选取2名共和党人、2名 
民主党员和3名无党派人士组成一个七人委员会.一共有多少种选法？ 



习 m . is 


19.从8女6男里选择3女3男组成委员会，一共有多少种选法？如果 


( a ) 其中有两个男人不愿同时进入委 员会； 

( b ) 其中有两个女人不愿同时进入委 员会； 

( c ) 其中有一男一女不愿同时进入委员会. 

20. 某人有8个朋友，他打算遨请其中5人参加茶会， 

( a ) 如果有某两人长期不和，不能同时参加茶会，他有多少种遨请方案？ 

( b ) 如果有某两人只能同时被遨请，一共有多少种邀请方案？ 

21. 如下图，从标有>1的地方出发，每一步只能向上或者向右移动，问移动到 S —共有多少 
种移动方式？ 

提示： 从 A 到 B 需向右4步，向上3步. 


22. 在习题21中，如果要求必须经过标有圆圈的点（如下图)，一共有多少种移动方式？ 



( 












23. 某从事睡梦研究的心理学实验室有3间房,每间房里有2 张床. 现要安排3对双胞胎进行 
睡梦实验，要求每对双胞胎必须安排在同+ •间房的不同床上，一共有多少安排方法？ 

24. 展开 (3® 2 + y ) 8 . 

25. 桥牌比赛中有四个选手参加，每人分到13张牌，一共有多少种分法？ 

26. 展开 （ a：i + 2*2 + 3i3) 4 . 

27. 将12个人分成各含3人、4人和5人的委员会，一共有多少种方法？ 

28. 将8个老师分配到4个学校，一共有多少种分法？如果要求每个学校必须接收2个老师 
呢？ 

29. —共10个举重选手参加比赛，其中3名美国选手、4名俄罗斯选手、2名中国选手和1 
名加拿大选手.如果成绩只记录每个选手的国籍，一共有多少种可能结果？如果美国选手 
有1名在总成绩前三名，另两名在总成绩的最后三名中，那么—共有多少种可能结果？ 
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30. 有分别来自俄国、法国、英国和美国等10个国家的代表坐在 一排， 如果法国和英国代表 
坐在一起,俄国和美国代表不坐在一起，一共有多少种坐法？ 

*31. 8块相同的黑板分给4所学校,一共有多少种分法？如果要求每所学校至少分到1块黑板 
呢？ 

*32. 电梯载着8个人（不包括电梯工）自底层启动，到顶层6楼后，乘客己全部下完.如果电梯 
工只注意到每层楼出去的人数，那么他能看到多少种离开电梯的方式？如果8个乘客中 
有5个男人和3个女人，而电梯工又只注意了出去人的性别，问埋的答案又是多少？ 

*33 .有2万美元要投资到4个项目上，每份投资必须是1000美元的整数倍，且每个项目如果 
有投资的话，最少投资额分别为2000, 2000, 3000和4000美元，一共有多少种可行的投 
资方法，如果 

( a ) 毎个项目都要 投资； （ b ) 至少投资其中3个 项自. 

理论习题 

1. 证明推广的计数基本法则. 

2. 进行两个试验，第一个试验有 m 个可能的结果.若第一个试骑得到第 i 个结果，则第二个 
试验有叫个可能的结果，< = 1,2,. . , m . 问这两个试验一共有多少种可能结果？ 

3. 从 n 个元素里取7•个，如考虑抽取次序的话有多少种取法？ 

4. 有 rz 个球，其中 r 个黑球 ， n - r 个白球，把它们排成一排，用组合学知识解释共有 
种排法. 

5. 计算形如 ( xi ,* a , •• - , x „) 的向量的个数，其中; t * 等于0或者1,且 

6. 有多少个这样的向童 ( ii , ••- 其中 A 是正整数，且满足1 矣 x * < n 和 ; d <奶< 

… < lit? 

7. 用分析的方法证明等式 （4.1). 

8. 证明 (” m ) = G)d+(U + ...+ 0© 

提示： 设有 Ti 个男人和 m 个女人，从中挑选 r 人，一共有多少种挑选方法？ 

9. 利用理论习题8的结论 证明 ： ( 2 j = E 2 =o (；) 2 

10 .从 n 人中选取 fc 人组成一个委员会， k ^ n , 其中一人被任命为主席. 

( a ) 考虑先选出 fc 人,然后任命其中一人为主席，说明总共有 ( J )*： 种可能方式. 

( b ) 考虑先选出 fc _ 1人，其中没有主席，然后再在剩下的 n-fc + 1 人中选一人为主席, 
总共有 (fc 2 1 ) (n 一 + U 种可能方式 • 

( c ) 考虑先选出主席，然后再选出其他成员，说明一共有种可能选择. 

( d ) 总结 （ a ), ( b )，（ c )， 得出 =( n - fc + l )( fe ^ 1 )= n (^ 1 1 ) 

( e ) 利用的阶乘定义证明 （ d ) 中等式. 




11. 以下是费马组合恒 等式: 


理论习題 17 


®= g ( i : i ) … 

试从组合的角度，而不用计算的方法，去验证该恒等式. 

提示： 考虑由数字1,…， n 所组成的集合，以 i 为最大值的含有 fc 个元索的子集一共有 
多少个？ 

12. 考虑如下组合恒 等式： 

± k ( l )= n 2^ 

( a ) 试从组合的角度解释上式，可考虑从 n 人中挑选若干人组成委员会并在其中选定一 
名主席的可能方式的两种计算方法. 

提示： 

( i ) 如果选择 fc 人组成会员会并选定一名主席，一共有多少种方法？ 

( ii ) 先选好主席，然后再选其他成员，一共有多少种选法？ 

( b ) 证明以下等式对71=1,2,3,4,5都 成立： 

E (!)* 2 = 2 " _an ( n +” 

为了从组合的角度证明上式，指出上式的两边都等于如下的可能选择 方式： 考虑有 n 
个人，从中选择若千人组成一个委员会，并选定主席和秘书（有可能是同一人). 

提示： 

( i ) 委员会一共有 fc 人，一共有多少种选择方式？ 

( U ) 如果主席和秘书为同一人，一共有多少种选择方式？（答 案： U 2"- 1 ) 

( iii ) 如果主席和秘书为两个不同的人，一共有多少种选择方式？ 

( c ) 证明 E?-i ( l ) k 3 = 2- 3 n a (n + 3) 

13. 证明，对 n > 0, 有 E ?= 0 (- i)‘©=o 
提示： 利用二项式定理. 

14. 从 n 个人里选 j 个人组成委员会，再从这委员会里选 i 个人组成分会 ， i < 乂 

( a ) 用两种方法分别计算委员会和分会的可能选择数来导出组合恒等式.其中，第—种方 
法是先选 择:/ 个人组成委员会,再从中选择 i 个人组成分会.第二种是先选择 < 个人 
组成分会，再补充 j - i 个人组成委员会. 

⑼ 利用⑷ 证明组合恒 等式： E ?= i (")( j ) = (")2"- 4 

⑷利用 （ a ) 和理论习题 13 证明 E 7= i (")©(-1)"- J =0 i < n 

15 . 令 Hk { n ) 为向量 ( a ： i ,*3, •• - ,* k ) 的数目，其中： c * 是正整数且满足1 < a ：* < n 及 
x\ < la < • • • ^ affc- 
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( a ) 不用任何计算，说明 


Hi ( n ) = n 

H ^ n ) = ^ fc>i 

i=i 

提示： 如果 x k = j , 那一共有多少向量？ 

( b ) 利用上述递推公式计算 ff 3 (5). 

提示： 先计算对 n = l ,2,3,4,5. 

16. 有 n 个选手参加比赛，最后排定成绩，同时允许选手排名相同.那么，就可按排名成绩将 
选手分成组，成绩最好的第一组，成绩其次的第二组，等等.记 N ( n ) 表示不同结果的可 
能数，比如 N (2) = 3,因为在一个只有2名选手参加的比赛中，比赛结果一共有3 种：第 
一个选手获第一，第二个选手获第一，两个选手并列第 一. 

( a ) 列出所有 n = 3时的可能 结果； 

( b ) 令尺⑼=1,不用任何计算，说明 N ( n ) = (") jV ( n - t ) 提示： 共有 i 个选手 

并列最后一名，一共有多少种结果？ 

(c) 证明上述公式等价于 N ( n ) = Oi ) 

( d ) 利用上述递推公式，求出尺⑶和況⑷ ■ 

17. 从组合的角度解释 (:) = ( 二). 

18. 证明 


(ni,na, … ,nr) ~ (ni-l,na, ••-, nr) + Lu n 3 -l, ?_ • ， rj + . + (m,r» 2 ， n •: :n r - 1) 


提示： 利用证明公式 (4.1) 的类似方法. 

19. 证明多项式定理. 

*20 .将 n 个相同的球放到 r 个坛子里，要求第 i 个坛子至少有个球 , i = 1, •…， r , 一共有 
多少种放法？假设 n >!：；•_ n » 4 . 

*21 . 说明方程 Si +12 + … + Ir = »» 正好有个解，其中有*^个*为 0 . 
•22. 考虑 n 元函数 /(*!,■•• , in ), 一共有多少个 r 阶偏微分？ 

*23. 求向量 ( xi ,---, x „) 的数目，其中 A 为非负整数且满足 


自检习题 

1. 宇母 A , B , C , D , E,F —共有多少种排列方式，如果 

( a ) A 和 B 必须在一起； （ b ) A 在 B 之前； 

( c ) A 在 B 之前， B 在 C 之前； （ d ) A 在 B 之前， C 在 D 之前; 

( e ) A 和 B 必须在一起， C 和 D 也必须在一起； （ f ) E 不在最后. 
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2- 4个美国人、3个法国人和3个英国人坐在一排，要求相同国籍的人必须坐在一起,一共 
有多少种坐法？ 

3. 从有10人的俱乐部中分别选1名总栽、1名财务和1名秘书，一共有多少种选法，如果 

( a ) 没有任何 限制； （ b ) A 和 B 不能同时 被选； 

( c ) C 和 D 要么同时被选，要么同时不 被选； （ d ) E 必须 被选； 

( e ) F 被选中的话，必须担任总栽. 

4. 一次考试中，学生应从10道考题中选择7道回答，一共有多少种选法？如果规定必须 
在前5道中至少选3道,那么有多少种选法？ 

5. 某人将7件礼物分给他的3个孩子，其中老大得3件，其余两人分别得2件，一共有多 
少分法？ 

6. —块汽车牌照的号码由3位字母和4位败字组成.如果允许字母或数字重复且位置没 
有任何限制，一共有多少种可能的牌照号？ 

7. 从组合的角度解释恒等式 ： (；5 = ( n 2 r ). 

8. 考虑一个 n 位数，每位数宇都是0,1, _ ■ , 9中的一个，一共有多少个这样的数？如果 
( a ) 相邻的两位数宇均不 相同； （ b ) 0出现 i 次 , i = 0, • • • , n . 

9. 有三个班级，每个班级有 n 个学生，从这 3 n 个学生中选3人. 

( a ) —共有多少种选法？ 

( b ) 如果3人来自于相同班级，一共有多少种选法？ 

( c ) 如果有2人来自于相同班级，另1人来自于其他班级，一共有多少种选法？ 

( d ) 3人分别来自不同的班级，一共有多少种选法？ 

( e ) 利用 （ a ) 到 （ d ) 的结果，写出一个组合恒等式. 

10. 由数宇 1,2,. •• ,9组成的5位数一共有多少？这5个数字中不容许有数字重复多于2 
次（例如，41 434是不容许的). 

11. 从10对夫妇中选出6个人,但不容许夫妇同时入选. 

( a ) —共有多少种不同的选法？ 

( b ) 若规定这6个人中必须是三男三女（当然夫妇是不容许同时入选的)，一共有多少种 
选法？ 

12. 从7个男人、8个女人中选取6人组成委员会.如果要求至少3个女人、2个男人，一 
共有多少种选取方法？ 

*13. 一个艺术品收藏拍卖会一共有15件艺术品，其中4件达利的、5件凡髙的和6件毕加 
索的.一共有5名艺术品收藏家买下了这批艺 术品. 而某记者只记载了每位收藏家得到 
的达利、凡高和毕加索作品的数量，问销售记录能有多少种不同的结果？ 

*14. 计算向量( II , ••- ,* n ) 的个数，如果 A 是正整数，且< fc , 其中 fc > 

16. n 个学生参加保险精算师的考试，公榜结果只列出那些通过考试的学生名单，并且按照 
他们的分数由髙到底进行排序，例如，公榜结果为 “ Brown , Cho ” 意味着只有 Brown 和 
Cho 通过了考试，而且 Brown 分数比 Cho 的髙.如果没有相同的分数，那么公布的考 
试结果一共有多少种情况？ 

16. 从集合 S = {1,2, ••- ,20} 中选4个元素组成子集，并且1,2,3,4,5中至少有一个被选 
中，一共有多少种子集？ 
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17. 给出下列恒等式分析的证明 

® = ® +A：(n_A：)+ ( n ; fc ) 

并给出该恒等式的组合解释. 

18. —个社区的构成是这样 的：有 3户单亲家庭带1个子女，有3户单亲家庭带2个子女， 
有5户双亲家庭带一独生子女，7户双亲家庭带2个子女, 6户双亲家庭带了 3个子女. 
现在要从某一家庭中选取一个家长和一个孩子，一共有多少种选法？ 

19. 汽车牌照号由8位数宇或宇母组成，但规定数宇或宇母不能重复，对于数字或宇母的位 
置不作任何限制，这样共有多少种不同的汽车牌号？若还规定3个数字必须是相连的， 
那么问一共可有多少种不同的汽车牌号？ 



第 2 章概率论公理化 

2.1 简介 

本章介绍事件的概率这一概念，并展示在某些特定情形下计算概率的方法.在 
引入概率的概念之前，先要学习更基本的 概念一 试验的样本空间和事件. 

2.2 样本空间和事件 

假设某次试验的结果是不可预测、不确 定的. 当然，尽管在试验之前无法得知 
结果，但是假设所有可能的结果的集合是知道的.所有可能的结果构成的集合，称 
为该试验的样 本空间 (sample space ), 并记为 S . 以下是样本空间的一些例子. 

(1) 若试验是考察新生要儿的性别，那么所有可能结果的集合 ■?= { g ， b } 就是 
一个样本空间，其中 g 表示“女孩”， b 表示“男孩”. 

(2) 赛马比赛中一共有7匹马参赛，这7匹马分别标以1,2,3,4,5,6, 7. 考察比 
赛结果，所有可能的比赛结果的集合5 = {(1,2,3,4,5,6, 7 )的所有7!种排列}就是 
—个样本空间•比如 （2, 3,1,6,5,4, 7) 就表示2号马跑第一，3号马跑第二,接下来 
是1号马……这是比赛的一种可能结果. 

(3) 掷两枚硬币，考察哪一面朝上，那么样本空间一共包含如下四种结果： 

S = {(H ， H),(H ， T) ， (T,H),(T ， T)} 

其中 ( H . H ) 表示两枚硬币都是正面朝上 ®; ( H , T ) 表示第一枚硬币正面朝上，第二枚 
反面 朝上； （ T ， H ) 表示第一枚硬币反面朝上，第二枚正面 朝上； （ T ， T ) 表示两枚硬币都 
是反面朝上. 

(4) 掷两枚敢子，考察两枚敢子的点数，那么样本空间包含36个 结果： 

S = {( i , j ) : i,j = 1,2,3,4,5, 6} 

其中， （ i , j ) 表示第一个敢子的点数是 i , 第二个骰子的点数是:/ • 

(5) 考察一个晶体管的寿命（小时)，那么样本空间是所有的非负实数，即 

5 = {x ： 0 ^ x < oo } 

①本书中，我们约定 H 表示正面朝上， T 表示反面朝上 .一 译者注 




22 第 2 幸概芈论公理化 


样本空间的任一子集 E 称为事件 ( event ), 事件就是由试验的某些可能结果组成的 
一个集合.如果试验的结果包含在£里面，那么就称发生了.以下是一些有关 
事件的 例子： 

在前面的例 （1) 中，令£： = { g }, 那么就表示“婴儿是个女孩”这个 事件; 类 
似地 ， F 就表示“婴儿是个男孩”. 

在例 (2) 中，如果 £ = { 所有以3开头的排列那么 E 就表示 “3号马获得了第 


在例 （3) 中,如果£ = {( H , H ),( H , T )}, 那么£就表示“第一枚硬币正面朝上” ■ 

在例 （4) 中，如果 £ = {(1，6)，(2,5)，(3,4)，(4,3)，(5,2)，(6，1)}， 那么丑 就表示 
“两个敢子点数之和为 7”. 

在例 （5) 中，如果£； = {re : 0 < a : < 5}, 那么£就表示“晶体管的寿命不超过 
5个小时”. 

对于同一个样本空间 S 的任两个事件 E 和定义一个新的事件£ U i •'它 
由以下结果 组成： 这些结果或在£里，或在 F 里，或既在 S 里也在 F 里•也 
就是说，如果事件£或者事件 F 中有一个发生，那么就发生.比如在例 
(1) 中，如果 E = { g},F = { b }, 那么 EUF = { g , b }, 也即， EUF 与整个样本 
空间5是一致的.在例⑶中，如果£ = {( H , H ),( H , T )} RF = {( T , H )}, 那么 
EVF = {( H , H ),( H , T ),( T , H )}, 因此， EUF 意味着“至少有一枚硬币正面朝上”. 

事件 EUF 称为事件和事件 F 的并 ( union ). 

类似地,对于任意两个事件£和 F ， 还可以定义称为只和 F 的交 ( inter - 
section ), 它由£和 F 的公共元素组成.也即事件有时也记为 EnF ) 发生当 
且仅当 B 和 F 同时发生.比如在例⑶中，事件 E = {( H , H ),( H , T ),( T , H )} 表示 
“至少有一个正面朝上”，而 F = {( H , T ),( T , H ),( T ， T )} 表示“至少有一个反面朝 
上”，那么 EF = {( H , T ),( T , H )} 就表示“正好一个正面朝上，一个反面朝上”.在 
例⑷中，事件£； = {(1，6)，(2,5)，(3, 4),(4,3), (5,2)，(6, 1)} 表示两个骰子点数之和 
为7,而 F = {(1,5)，(2,4)， (3,3)，(4, 2), (5,1)} 表示骰子点数之和为6,那么不 
包含任何试验结果，所以它也不可能发生_类似这样的事件,称为不可能事件，记为 
0( 也即，0是不包含任何结果的事件).如果 EF = 0，则称£和 F 是互不相容的 
(mutually exclusive ). 

用类似的方式再来定义两个以上事件的并 和交.设玢，氏 ，…是一系列事件， 
这些事件的并记为 U~=l E n , 表示至少包含在某一个五 n 里的所有结果所构成的事 
件.同样，这些事件的交记为 n ~= l ^ n , 其含义为包含在所有里的所有结果构成 
的事件. 

最后，一个事件的补事件记为 P ， 其含义是包含在样本空间里但不包含在五 
里的所有结果构成的事件.也即，及=发生当且仅当五不 发生. 在例 （4) 中，如 



E = {(1，6)，(2,5)，(3,4)，(4,3), (5,2), (6,1)}, 那么当两个殺子点数之和不等于 7 时， 
^发生.值得说明的是，样本空间 S 的补集 5^ = 0. 

对于任两个事件 E 和如果 E 内的所有结果都在 F 中，那么称 E 包含于 
F, 记为£ C F (或者 F 3 E). 因此，如果 E C 那么£发生也就能推出 P 也发 
生.如果 E C F 和 F C 那么称 E 和 F 是相同的，记为£ = F. 

韦恩图 (Venn Diagram ) 是一种用来阐述事件之间的逻辑关系的非常有效的几 
何表示方法.样本空间 S 表 示为一 个大的矩形，表示包含了所有可能结果，事件 
E ， F ， G ， … 表示为包含在矩形之内的一个个小圆，所关心的亊件可以用相应的阴影 
区域来 表示. 比如，在图 2.1 的三个韦恩图中，阴影部分分别表示 EUF，EF 和砍. 
图 2.2 表示 ECF . 



< a > 阴影 b (域： t'Uf ( b > M 影 K 域 ：( c > 阴影区域： A ’* 

图 2.1 韦恩图 


并、交和对立事件遵循类似于代数学 
里的一些运算规则，列举 如下： 

交 换律 ： EUF = FUE EF = FE 
结 合律 ： （E U F ) U G = E U (F U G ) 

( EF)G = E ( FG ) 

分配律 ：（£ U F)G = EGUFG EFU 
G = ( EUG )( FUG ) 

上述式子可以通过以下方式来 证明： 先证明等式左边的事件里的任一结果必 
然包含于等式右边的事件，再证明等式右边的事件里的任一结果也包含于等式左边 
的事件.另一个显而易见的方法就是利用韦恩图，比如图 2.3 就表示了分配律. 



⑻阴影区域： £G (b> 阴影 区域： FG (c> 阴影 区域： (£UFKJ 

{EUf)G=EGl)FG 

图 2.3 分配律 



图 2.2 亊件的包含关系 
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下面关于并、交及对立事件这三个基本运算之间的重要的关系式称为德摩根 
定律 （ DeMorgan’s laws )： 

( u ^ V ^ n ^ ( n ^ V = u ^ 

\t=l / i=l \»=1 / »=1 

为了证明上述定律，首先假设: r 是 ( ur = i ^) c 里的一个元素，那么工不包含 
于 U ?=1 Ei , 这就意味着 X 并不包含于任一个事件拉 ， i = 1,2, …， n, 所以对任意 
i(i = 1,2,…， 《) 来说，: T 就包含于拉，也即0：包含于 n ： U 母 另一方面，假设 z 
包含于 n ?= i 校,那么对任— t ,* = l ,2, - - , n , x 包含于 £?• 声就意味着； E 不属于 
所 有的瓦 ，即 z 不包含于11二 及也即 1 包含于 ( UU 及 y . 这样就证明了德摩 
根定律的第一条. 

现证明德摩根定律的第二条，由第一条定律可知 

(Q 耵） = t Q (E?)C 

这样，由 ( f^) c = E , 上式等价于 

( y ^) = 0 r Ei 

对两边取补运算，即得到如下 结果： 

jj ^=( q ^) 

2.3 槪率论公理 

一种定义事件发生的概率的方式是利用事件发生的频率 • 定义 如下： 一个试验 
的样本空间为 S , 在相同的条件下可重复进行.对于样本空间 S 里的事件五，记 
n (£) 为 n 次重复试验中亊件 E 发生的次数.那么，该事件发生的概率 

P { E )= lim 

、’ n—oo n 

即概率 P (£) 定义为 E 发生的次数占试验总次数的比例的极限，也即发生频率的 

极限虽然上述定义很直观,而且大多读者也一直这么认为，但它却有很严重的缺陷. 
怎么就知道 n ( E )/ n 会收敛到一个固定的常数，而且如果进行另一次重复试验，它 
也会收敛到这个相同的 常数？ 例如，设想进行这样的试验：重复掷一枚硬币 n 次， 
怎么能保证在 n 次试验中正面朝上的比例会随着 71 的增大而收敛于某个数？而且， 
即使它确实收敛于某个数，又如何保证进行另一次同样的重复试验时，其比例会趋 
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于同样的值？ 

用频率来定义概率的支持者常常这样回答上述问题，他们认为 n ( E )/ n 趋于某 
常数是整个系统的一个假设，或者说一个公理 ( axiom ). 但是，这个假设非常不简洁. 
因为，尽管事实上需要假定频率的极限是存在的，但是这却不是一个最基本、最简 
单的假设.同时，这样的假设也不一定为所有人所认同.事实上，先假定一些更简 
单、更显而易见的关于概率的公理,然后去证明频率在某种意义下趋于一个常数极 
限不是更合情合理吗？这也正是本书采纳的现代概率论公理化方法.特别地,仍假 
定对于样本空间里的任一事件 E ， 都存在一个值 P ( B ) (指的就是 事件五 的概率)， 
并假定这些概率值符合一系列公理.读者一定会认可这些公理，因为这些公理很接 
近于对概率的直觉认识. 

假设某个试验的样本空间为对应于其中任一事件£,定义一个数 P ( E )， 满 
足如下3条公理. 


公理1 0彡尸 (五）<1 
公理2 P ( S ) = 1 

公理3对任一系列互不相容的事件 E lt Eh, ■■- (即如果的，则 ^ = 0), 
有 。O OC 

p (u^) = £ p(e<) 

<=1 i=l 


我们把满足以上3条公理的 P ( E ) 称为事件 J 5 的概率. 

公理1说明，任何事件£的概率在0到1 之间. 公理2说明， S 作为必然发 
生的事件，其概率定义为1.公理3说明对任意一列互不相容亊件，至少有一事件 
发生的概率等于各事件发生的概率 之和. 这些公理简明又直观 • 

设 E u Eh ，" 为一特殊的事件序列，其中五：= S,Ei = 0, i > l , 此时各个事 
件互不相容，且 S = 尽.由公理3可以 得到： P { S ) = E~i P ( Ei ) = P ( S ) + 

J ：~ 2 P (0) 这就说明 F (0) = 0, 也即空事件发生的概率为 0. 

' 值得注意的是，对于有限个互不相容事件的序列 EA ，…， E n ，有 

p(\j E i)=iz p ^ (3i) 

v i=i >=1 

为证明这个结论，只需在公理 3 中，令所有氏 (i > n ) 为空事件即可_当样本空 
间为有限集时，公理3与上式是等价的，但当样本空间是无限集时，公理3的关于 
事件概率可加性的推广就是必要的. 

例 3 a 掷一枚硬币，记正面朝上的事件为 H , 反面朝上的事件为 T . 假设两者 
发生的可能性一样，那么 P ({ H }) = P ({ T }) = 




26 第 2 幸概芈论公理化 


另外，如果这个硬币有偏向，而且正面朝上的机会是反面朝上机会的2倍，那 
么 p ({ H })=|， p ( m ) = |. ■ 

例 3 b 掷一枚骰子，若6个面出现的可能性是一样的，这样就有 P ({1}) = 
P ({2}) = P ({3}) = P ({4}) = P ({5}) = P ({6}) = 1/6. 从公理 3 可知出现偶数面朝 
上的概率为 P ({2,4,6}) = P ({2}) + P ({4}) + P ({6}) = |. ■ 

设 P(E) 是定义在样本空间里的事件的集函数,若它满足公理1，2, 3,则 P(E) 
就是事件£；的概率.这一定义是现代概率论的数学基础.我们认为，读者会认为 
这些公理很自然，而且与对概率的直觉概念（也即概率是与机会和随机性有关的知 
识）很吻合.进一步，利用这些公理可以证明，随着试验的不断进行，事件 E 发生的 
频率趋近 P(E) 的概率为 1. 这就是第8章将要介绍的强大数定律.另外， 2.7 节还 
将介绍概率的另一种解释，即概率可作为确信程度的度量. 

技术注释我们假定概率 P(E) 是针对样本空间里的所有事件 E 定义的，事 
实上，如果样本空间是不可数集，那么 P(E) 仅仅针对那些所谓可测的亊件进行定 
义.但是，这并不是概率论的缺陷，因为所有现实中的事件都是可测的. 

2.4 几个简单命题 


这一节证明几个有关概率的简单性质.首先注意到£ 和五 £ 总是互不相容的， 
而且 五 c = S, 因此由公理2和公理3可以得到 

1 = P ( S ) = P(E UE C ) = P ( E ) + P(f^) 

以下的命题 4.1 便是上式的等价形式. 

命题 4.1 P(£^) = 1 - P ( E ) 

| _ _ _ 

命题 4.1 说明，一个事件不发生的概率，等于1减去它发生的概率.比如，掷一 
枚硬币，若正面朝上的概率是3/8,那么反面朝上的概率一定是 5/8. 

接下来的第二个命题指出了如果事件 B 包含于事件 F ， 那么£发生的概率必 
然不大于 F 发生概率. 


| 命題 4.2 如果 B C 那么 P { E )^ P { F ). 

证明： 由£ C 可将 F 表示为 F = E\J E ^ F , 这样，因为 £ 和是互 
不相容的，由公理3可得 P ( F ) = P ( E )+ P { E C F ). 由于 P ( E c F )^0, 因此 P ( E )^ 
P { F ). □ 

举个例子，掷一枚骰子，出现1的概率肯定小于等于出现奇数的概率. 
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下一命题借助两事件的概率给出了它们的并的概率与交的概率之间的关系. 
命® 4.3 P(E UF ) = P ( E ) + P ( F )~ P ( EF ) 

证明： 注意到 BUF 可以表示为两个不相容事件五和於 F 的并,根据公理3 


可知 


P(E UF ) = P(EU JS ° F ) = P ( E ) + PiE ^ F ) 


另外，由 F ^ EFUE ^ F , 再利用公理 3 也可以得到 
P ( F ) = P ( EF ) + P { E ^ F ) 


或等价地， 

P { E ^ F ) = P ( F )- P ( EF ) 

将它代入前面关于 P ( EUF ) 的表达式，命题得证. 

命题 4.3 也可以利用韦恩图来证明，如图 2.4. 

将 EUF 分成3个互不相容的部分，如图 2.5 所示•第 I 部分表示的是所有属 
于 E 但不属于 F 的点（也即£尸)，第 II 部分表示的是所有既属于£也属于 F 的 
点（也即£杓，第 III 部分表示所有属于 F 但不属于五的点（也即 E - F ). 



图 2.4 韦恩图 



图 2.5 韦恩图的3个部分 


从图 2.5 上可以看出， 

£UF = IUlIuni £； = lun F = II U III 
由于 I ， II ， III 是互不相容的，结合公理3可以 得到： 

P(E UF ) = P ( I ) + P ( n ) + P ( m ) P ( E ) = P ( I ) + P ( U ) P ( F ) = P ( U ) + P ( III ) 
由以上就可以得出 P(E UF ) = P ( E ) + P { F )~ P ( II ), 又因为 ll=EF , 命题 4 .3 得 
以证明. □ 

例 4 a 某人度假时随身带了两本书.他喜欢第一本书的概率为0. 5 ,喜欢第二 
本书的概率为0.4,两本书都喜欢的概率为0.3,问两本书都不喜欢的概率是多大？ 
解••令氏 表示他喜欢第 i 本书 （i = 1,2), 那么他至少喜欢一本书的概率为 
P ( BiUB 2 ) = P ( Bj ) + P ( B 2 ) - P { BiB 2 ) = 0.5 + 0.4 - 0.3 = 0.6 






28 第 2 幸概率论公 g 化 _ 

因为两本书都不喜欢的对立事件是至少喜欢一本书，所以 

= P((Bi U Ba ) c ) =1 - P(Bi U S 2 ) = 0.4 
以下公式计算三个亊件 E,F ， G 之中至少有一个发生的 概率： 
P ( EUFUG ) = P [( EUF ) UG 1 

由命题 4.3 可知上式等于 

P(E UF) + P(G)~ P[(SU F ) G ] 

由分配律可知 （ EUF)G = £GUFG , 因此由上面式子可得 

P(EUFUG) = P(E) + P ( F )- P[EF) + P(G) - P(EGU FG) 

= P(E) + P(F)- P{EF) + P(G)~ P(EG) - P(FG) + P(EGFG) 
= P(E) + P ( F ) + P ( G )- P(EF) - P{EG) - P(FG) + P(EFG) 


以下的命题，也称为容斥性等式 ( inclusion-exclusion identity ), 可由归纳法推导 
得到. 



也就是说， n 个亊件并的概率，等于这些事件的概率之和，减去两个事件同时 
发生的概率之和，再加上三个事件同时发生的概率之和 …… 


注释 1. 作为命题 4.4 的直观解释，首先注意到如果样本空间里的某个结果 
不属于任意的尽，那么等式两边都不应该有它的概率.另一方面，假设某个结果正 
好包含在 m 个 氏里面 （其中 m > 0), 那么既然它属于 \ JiEi , 这个结果的概率在 
PdJ . Ei ) 中只计算一次.而且，因为这个结果也被包含在形如 E ilt E ……， E ik 这 
样的⑺ 个子集中 ， k = l ,--, m , 在命题 4 .4等式的右边，这个结果的概率被计 
算了 
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次.因此，对于 m > 0,我们必须证明 

，-©勢 …土 D 

然而，因为上式等价于 

f ⑺ (-”< = 0 

i=0 

而这是二项式定理的结果，因为 

0 = (-l + l) m = f ； (?)(-i)*(i) m_< 

«=o 


2. 以下式子是容斥恒等式更简明的 写法： 

p ( U B 0 = S (- 1 ) r+1 E . 匙) 

'»=! r=l <i<--«r 


3. 在容斥恒等式中，右边如果只取前一项，那么得到亊件并的概率的一个上 
界； 如果取前两项，得到事件并的概率的一个下界；取前3项，得到一个 上界； 取前 
4项，得到一个下界，以此 类推. 也就是说,对于亊件 E u …， E n ，有 

»=i *=i 

Cj 氏）》亡 w)-E P ( E 抑 (4 . 2) 

V t=l i=l 3<i 

P((jEi)^ P ( B <) - E P ( 啡 ) +E P ( E 兩阳 ( 4 . 3 ) 

'i=l ‘=1 j<i k<j<i 

等等.为了证明这些不等式，先注意到 


Q U E^EzU E ^ E^Ea U … U Ef … K - i^n 

i=l 


也就是说，尽里至少有一个发生，相当于说发生，或者说不发生，但是设发生， 
或 者私、 设都不发生，但£ 3 发生， 等等. 因为上式的右边是—系列互不相容事件 
的并,我们有 



= P(Ei) + 尸 ( 聊 )+ P ( 埒 柳 )+ …+ - - K-l E n) 

= P(E 1 ) + Y t P{E c 1 --E9_ 1 E i ) 

i=2 


(4-4) 
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令玖=所…拉^ = (u i<:i ^) C 表示前 i - 1个事件都不发生，利用恒等式 
P(E i ) = P(B i E i ) + P(B c i E i ) 


可证明 


P(Ei) = P ( 埒 … + p(£ i yE i ) 


= P{Ei) - p( y EiEj) 


将此代入 （4.4) 式即可得到 

p ( P 拉 ) =1>(拉） - 5>( U Ei E i) (4-5) 

因为概率总是非负的,所以，由 （4.5) 式便可直接得到不等式 (4.1). 然后，给定 i, 利 
用不等式 （4.1) 可得 

)<i i<i 


此式结合 （4.5) 式，又可得到 （4.2) 式. 现在给定 i, 将不等式 (4.2) 应用到 
PiUi ^ EiEj ), 可得到 

/>( U EiEj) > Y. P ^ E i E ^) 

j<i j<i k<j<i 

= Y l P ( E i E j )- ^ P ^ EjE ,) 

j<i k<j<i 

由上式，结合 （4.5) 式,便可得到 （4.3) 式.其他的不等式都可以通过这种方法 
得到. 


2.5 等可能结果的样本空间 

对很多试验来说，一个很自然的假设是，样本空间里的所有结果发生的可能性 
是一样的.也即，假定样本空间 S 是个有限集，不妨设为5 = {1，2,… ,N}, 这时就 
经常会自然地假设 

=尸㈣=…= P(W) 

结合公理2和公理3,上式意味着（为什么？） 

P({i}) = ^ i=l,2,---,N 
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再利用公理3就可以得到对任何 事件五 

g 中的结果数 
^ 卜 S 中的结果数 

也就是说,如果假定一次试验里的所有结果都是等可能发生的，那么任何事件发 
生的概率等于 E 中所含有的结果数占所有样本空间里的结果数的比例. 

例 5 a 掷两枚敗子，朝上那一面数字之和为7的概率是多少？ 

解： 仍假设所有的36种可能结果都是等可能发生的，这样，就有6种可能结 
果满足数字之和等于7,即 (1,6),(2,5),(3,4),(4,3),(5,2),(6,1). 所以，两枚敢子点数之 
和为7的概率应该是6/36 = 1/6. 

例 5 b —个碗里面一共有6个白球，5个黑球，随机地从里面取出3个球，问 
恰好有一个白球两个黑球的概率是多少？ 

解： 首先考虑取球是有顺序的，样本空间一共包含11 x 10 x 9 = 990种结果. 
现在考虑事件“取出一个白球，两个黑球”所包含的可能 结果： 第一个球是白的，后 
两个球是黑的一共有6 x 5 x 4 = 120 种； 第一个球是黑的，第二个球是白的， 第三 
个球又是黑的一共有5 x 6 x 4 = 120 种； 前两个球是黑的，第三个球是白的一共有 
5 x 4 x 6 = 120种.“随机取”意味着样本空间的结果都是等可能发生的，所以，所 
,120+120+120 一土 
990 = IT. 

这个问题也可以认为取球是没有顺序的，从这个角度看，样本空间一共存在 


求概率为 - 


( 3 1 ) = 165种结果.当然，这165种结果也是等可能的.与事件“一个白球,两个黑 
球”相关的结果有种，因此，抽出一个白球和两个黑球的概率为 (®)©/ 

(^ 1 ) = 这个结果同前面答案是一致的. 

当涉及从 n 个对象中随机地选取 fc 个对象的时候，我们可以认为对象是从 n 
个对象的集合中一个一个地有序地选出来的，也可以认为从 n 个对象中一次取出 
k 个对象.当一个一个地取出来的时候，我们假定每次选择对象的时候，在待选的 
集合中的每一个对象有相同的概率被选中.在一次选择 fc 个对象的时候，我们假定 
g ) 个可能的子集有相同的机会被选中.例如,假定一个集体由10对夫妇组成，现 
在从中随机地选择5人.我们希望计算 P ( N ), 其中事件 AT 表示这5人中没有一对 
夫妇.首先，这20人中一共有个不同的人员组合，每一个可能的人员组合都 
有相同的机会被选中.而 iV 这个事件中的结果可以看成6阶段的试验的结果，第 
一阶段从10对夫妇中选定5对夫妇，后面的5个阶段是顺次地从每一对夫妇中选 
出一人.这样的试验共有( 1 5 °)2 5 种不同的结果.这样, AT 的概率为 
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P(N) = - • 


© 


我们也可以从顺序地选择这样的观点来计算 P ( AO . 从20个人中顺序地选择 
5个人,一共有 2019181716 种等概的试验结果.但是选择5个没有夫妇关系的5 
人组，只有 2018161412 个试验 结果. 这样 


20-18-16-14-12 
v ' 20 • 19 • 18 ■ 17 • 16 

经过简单的计算,这两个结论是相同的，至于具体的计算就留作练习吧！ ■ 

例 5 c —个委员会由5人组成，需要从6个男人和9个女人中随机选取，问 


委员会由3个男人和2个女人组成的概率有多大？ 


解： 假定随 机选取 则意味着所有种组合的选择是等可能的，而与亊件 

“3男2女”相关的结果有 QQ 因此所讨论亊件的概 率为： ©©/( s 5 ) 

240 

= Iooi- 

例 5 d —个坛子里共 n 个球，其中一个做了 标记. 如果依次从中随机抽取 fc 
个球，问做了标记的球被取出来的概率有多大？ 


解：从 n 个球中选取 fc 个球，一共有种选取方法，每一种选取方法都是 
等可能的.与亊件“选中带标记的球”相关的选法共有种 ，因此 


标记球被取出 } = 


(；)(；=；) 


k 


也可以这样求 解：设 fc 个球是顺序地被取出，记皋表示标记球在第 i 次被取出 
(t = 1,2, •••,*). 既然所有球在第 i 次被抽取的概率是一样的，可知 = 1/n. 
而这些事件是彼此互不相容的，因此， 

k k , 

P { 标记球被取出 } = P ( U ^*) = n 


另外， P { Ai ) = 1/ n 可以这样 推导： 考虑到抽球的过程是有顺序的，一共有 
n(n - 1) • • • (n - fc + 1) = n !/( n - Jb )! 种等可能试验结果，其中有 (n - l)(n - 
2 )...(„_i + l )( l )( n - t )- -( n -*: + l ) = ( n - l )!/( n - fc )! 种试验结果表示标记 
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球在第 i 次抽取时被取出，因此 

P(Ai)= {n ~p- ■ 

例 5 e 有 n + m 个球,其中 r » 个红的, m 个蓝的，将它们随机排成一排，也即 
所有 (n + m )! 种排列都是等可能的.如果只顺序地记录下所排列的球的颜色,证明 
将球的颜色序列作为试验结果的时候，这些试验结果仍然是等概的. 

解： 我们将 (n + m ) 个球的次序排列称为一组球的排列，将 n + m 个球的颜色 
次序排列称为一组球的颜色次序排列.球的排列共有 （n + m )! 种，将红球之间作 
任何一个位置的置换，将蓝球之间作任一位置置换，置换的结果并不影响球的颜色 
次序排列.从而，一组球的颜色次序排列，对应于 n ! m ! 个球的排列.这说明球的次 
序排列也是等可能的.并且每一种颜色次序出现的概率为 n ! m!/(n + m )!. 

例如，假设有2个红球，记为 r ,, r 2 ; 两个蓝球，记为 bx . ba ； 这样，一共有4!种 
球的排列，每一个颜色次序的排列，对应于2!2!个球的排列.如下面四个球的排列 
对应于相同的颜色次序 排列： 

ri ， bi ， r 2, b 2 ri , b 2, r 2 ,bi r 2, bi , ri , b 2 r 2, b 2, ri,bi 
因此,每一个颜色次序排列出现的概率为4/24 = 1/6. ■ 

例 5 f 在扑克牌游戏中，一手牌有5张，如果这5张牌是连续的，但又不是同 
一花色，那么称为顺子，比如，“黑桃5,黑桃6,黑桃7,黑桃8,红桃9” 就是一副顺 
子.试求-手牌是顺子的概率是多大？ 

解： 假设所有( 5 5 2 )种组合都是等可能的.先看看由 “ A ,2,3,4,5” 这5张牌（花 
色不同> 能组成多少个顺子，首先， “ A ” 有4种可能，同样其他4张牌也分别有 4 
种可能,所以，一共有4 5 种可能,但是,其中有 4 种可能是5张牌是同花色（这种情 
况称为同花顺)，所以一共是4 6 -4种顒子.类似地，“10, J , Q ， K ， A ” 这种顺子也有 
4 5 - 4种，因此一共有10 x (4 5 - 4) 种顺子.这样所求概率为10 X (4 5 -4)/( 5 5 2 ) « 
0.0039. _ 

例 5 g —手牌有5张，如果其中3张点数一样，另两张点数也一样的话，称为 
“福尔豪斯” (full house , 也就是说“福尔豪斯”由3张点数一样的牌加上一对组成). 
试问一手牌恰好是“福尔豪斯”的概率是多大？ 

解： 同样也设所有( 5 5 2 )种组合都是等可能的.注意到像 “ 2 张10, 3张 J ” 这 

样的“福尔豪斯” 一共有 Q ) Q 种组合，又因为一对的点数有 I 3 种选择,在选定 
—对的点数后，剩下12种可能的点数用于选择3张一组 的牌. 所以所求概率为 

13 X 12 X ©(3)/(5) = 0 0014 ■ 
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例 5 h 桥牌比赛中，52张牌被分给4位选手，求下列事件 概率： 

( a ) 其中有一人拿到了 13张 黑桃； 

( b ) 每人都拿到了 1张 “ A ”. 

解： （ a ) 记 及为第 i 个人拿到这13张黑桃的事件，显然 
P(Ei) = — , * = 1,2,3, 4 
© 

由于尽 （i = 1,2,3, 4) 是互不相容的事件，其中某一人拿到这13张黑桃的概率为 
0 及) == 4/0 6.3 x 10- 12 

、 isl ’ »=1 

( b ) 现来求每个选手恰好拿-张 “ A ” 的概率.先把 “ A ” 放一边，剩下48张 
牌分给4个人的可能分派方法数为( 12 12 48 12 12 ).接下来，将4张 A 分给4个 
选手的可能分派方法数为4!,因此，每 i 得到1张 A 的所有可能分派方法数为 
C , 12 ).从而所求概率为 

4!!< (12,1242,12)/(13,13^13,13) » 0105 5 ■ 

有些事件的概率是出乎想象的，下面两个例子就是如此 • 

例 5 i 房间里有 n 个人,没有两人在同一天生日的概率是多大？ n 多大时，才 
能保证此概率小于1/2? 

解： 每个人的生日都有365种可能，所以 n 个人一共是 365" 种可能（此处忽 
略有人生日是2月29日的可能性).假定每种可能性都是一 样的. 可知所求事件的 
概率为 （365)(364)(363) … （365 - n +1)/365". 令人惊异的是，一旦 n > 23,这个概 
率就比1/2要小，也就是说,房间里人数如果超过 2 3的话，那么至少有两人为同一 
天生日的概率就大于 1/2. 很多人一开始对这个结果很吃惊，因为23相对于一年 

365天来说太小了，然而，对每两个人来说,生 H 相同的概率为 23 个 

人，一共可以组成= 253对,这样看来，上述结果就不会太令人吃惊了- 

当房间里人数达到50时，至少两人同一天生日的概率大概为97%,如果人数 
达到100,那么两人同一天生日的优势（优势的定义见 3.3 节）为3 x 10 6 : 1，也就 

是说这个概率比还要大. ■ 

例 5 j 52张牌扣在桌上一张一张翻开，一直到出现一张 “ A ” 为止.接下来再 
翻一张牌，问出现黑桃 “ A ” 和出现梅花 2 的概率哪个大？ 
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解： 为了计算第一张 “ A ” 之后出现黑桃 “ A ” 的概率,先要计算在所有的 （52)! 
种可能的发牌次序中，有多少种是第一次出现 “ A ” 后紧接着就出现黑桃 “ A ” . 先 
将 5 1 张牌（去掉黑桃“ A ”） 任意排列，然后将黑桃 “ A ” 找个位置插进去，然而，只 
有一个位置即第一次出现 “ A ” 以后接下来的位置才是满足要求的位置.比如，假设 
其他51张牌的顺 序为： 

梅花4,红桃6,方块 “ J ” ，黑桃5,梅花 “ A ” ，方块7,……，红桃 “ K ” 

接下来，只有一种插入方法满足条件 ，即： 

梅花4,红桃6, 方块 “ J ” ， 黑桃5,梅花 “ A ” ，黑桃 “ A ” ，方块7,……,红桃 

“ K ” 

因此，第一张 A 出现后，紧接着是黑桃 “ A ” 的次序一共有 （51)! 种，而所求概 

率为 

P (第一张 A 后是黑桃“ A ”） = ||| = 士 

用同样的方法,可以得知，第一张 “ A ” 后出现梅花 2( 或任何其他牌）的概率也 
为 1/52. 也就是说, 52张牌中的任意一张牌（包括任意花色的 “ A ”） 出现在第一张 
“ A ” 后面的概率都是 1/52. 

这个结果会让很多人吃惊！事实上，一般的反应都是认为第一个 “ A ” 出现后， 
接着出现梅花2的概率要大于出现黑桃 “ A ” 的概率.因为第一•张 “ A ” 就有可能是 
黑桃 “ A ” 本身.这就减少了黑桃 “ A ” 紧接着第一张 “ A ” 的可能性.但是他忽略了 
第 -- 张 “ A ” 前面可以出现梅花2这一事实.这又减少了梅花2紧跟在第一张 “ A ” 
后的可能性.然而，因为有1/4的机会黑桃 “ A ” 是第一张出现的 “ A ” （因为4张 
“ A ” 出现在第一位是等可能的)，而且，仅仅有1/5的机会是梅花2出现在第一张 
“ A ” 之前（因为梅花2和四张 “ A ” 中的任一张排在最前面的可能性是相同的)，这 
点又好像说明了梅花2紧跟在第一张 “ A ” 后的可能要大一些.然而，事实并非如 
此，更深入的分析可以说明两者的可能性是一样的. _ 

例 5 k —个撤榄球队有20名进攻球员和20名防守球员，现在要给他们安排 
宿舍，每两人一个宿舍.如果随机分派，没有一个宿舍既有进攻队员也有防守队员 
(简称为“进攻防守对”）的概率是多大？正好有 2 i 对“进攻防守对”的概率是多大 
(t = l ,2,.-,10)? 

解：将 40人分成有序的20对一共有( 2 2 40 . 2 ) = ^4种可能•也就 

是说，一共有(40)!/2 20 种方法将这些选手分成第一对、第二对， 等等. 因此，一共 
有(40)!/[2 2 °(20)!]种方法分成不考虑顺序的20对.而且，要想不出现“进攻防守 
对”，只有将进攻队员之间配对,防守队员之间配对，一共有[(20)!/2 10 (10)!] 2 种方 
法.因此，没有“进攻防守对”的概率（记为 Po ) 如下： 
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( (20)! y 

V2»>(10 )!； [(20) !] 3 

°~ ~ (40)1 ^ "" [(10)!] 2 (40)! 

2 20 ( 20 )! 

现在计算 P 2< , 也即正好有 2 i 对“进攻防守对”的概率.首先，一共有 Q 2 种方 
法选取 2 i 个进攻队员和 2 i 个防守队员以便组成“进攻防守对”，这 4 i 个人能够 
组成 (2*)! 种可能“进攻防守对”（因为第一个进攻队员可以和 2 i 个防守队员配对, 
第二个进攻队员可以和 2 i - 1个防守队员配对，依此类 推). 剩下的20 - 2 i 个进攻 


队员（防守队员）只能内部 配对. 一共有 (^) 2 (2 t )! [ 上二):)! ] 2 种可能方式 
配成“进攻防守对”.因此 


P2i 


® 2 ( 圳 P^rr] 
(40)! 


i = 0， l ，." ，10 


2 M (20) ! 

这样,根据上述公式就可以算出 t = 0, l , -,10. 另外，利用 Stirling 公式 （n I 
n n +1 /2 e -" V 2 S ) 还可以算出其估值.比如 


P 0 «s 1.340 3 x 10一 6 Pio « 0.345 861 P20 « 7.606 8 x 10 -6 ■ 

接下来三个例子是命题 4.4 的运用.在例51中引入概率来迅速解决计数问题. 
例51 —个俱乐部里有36人会打网球，28人会打软式网球，18人会打羽 毛球; 
22人会打网球和软式网球，12人会打网球和羽毛球，9人会打软式网球和羽毛球; 
4人三种球都会打. 试问： 至少会打一种球的有多少人？ 

解：记 iV 为俱乐部总人数.设从俱乐部中随机地抽取一人，又假设 C 为它的 
任一子集，那么抽到一人刚好在 C 中的概率为 


设 T , S,B 分别表示会打网球、软式网球和羽毛球的人的集合，那么利用上述 
公式以及命题 4.4 可知 
P ( TU 5 UB ) 

= P ( T ) + P ( S ) + P ( B ) _ P ( TS ) - P ( TB ) - P { SB ) + P ( TSB ) 

36 + 28 + 18 - 22 - 12 - 9 + 4 _ 43 
= N = N 

因此,至少会打一种球的人数为 43 人. ■ 

接下来的例子不但有一个很让人吃惊的答案，而且在理论上也很有意义 • 

例 5 m (配对问题）房间里有 iV 人参加舞会.如果所有人都将帽子扔到屋中 
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央混在一起,然后每人再随机拿一个帽子.求没有一个人拿到自己的帽子的概率. 

解： 先计算至少有一人拿到自己的帽子的概率.记 £ i , i = 1,2,…，表示“第 
i 人拿到了自己的帽子”.这样，由命题 4.4, 至少有一人拿到了自己的帽子的概率 
为： 

N N 

p ( U 氏 )= E p ( 及 ) -E 

t=l «=1 ii«2 

+ (- l ) n+1 E P { E ix E i 2 .. E in ) 

il «3<—«n 

+ •■• + (-1) w+1 P(£ ； iE2 - En) 

如果把试验结果看成是一个 iV 维向量，其中第 i 个元素是第 i 个人拿到的帽子编 
号，这样一共有 AM 种可能的结果，例如，结果（1,2,3,_^ ， A 0 表示每人拿到的都 
是自己的帽子.进一步, Ei . Ei , …表示 ，…， i „ 这 n 个人拿到的是自己的 
帽子，这种可能性会有 ( iV - n )( JV - n - l )- -3-2 -l = ( iV - n )! 种，因为剩下的 
N-n 个人，第一个人有 N-n 种选择方法，第二人有 JV - n -1 种选择方法，依 
此类推.由假定知 AT 个人的 AH 种选择都是等可能的，因此 
P ( Eil E ia -.. E in )= ( -^^- 

又因—共含有项，所以 




N \( N - n )\ 

{ N - n )\ n \ N \ 




将上式代入 p ( ur = i ^) 的公式，得 

因此，没有一人拿到自己的帽子的概 率为： 

1 _ 1 + 奂_丟+…+ ( - 1 广 

当 N 足够大时，上值约等于 e - 1 w 0.367 8,即当 TV 很大时，没有一人拿到自己的 
帽子的概率接近 0.37. (有多少人会误地认为，当 JV — 00时，此概率值会趋近 1?) 


以下的例子展示了命题 4.4 的又一个应用. 


例 5 n 10对夫妇坐成一圈，计算没有一对夫妻坐在一起的概率 • 

解：记松 （i = 1,2, - - ,10) 表示第 i 对夫妇坐在一起，因此，所求概率为 


玖). 
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由命题 4.4, 

( 10 \ 10 

U 氏 = E p ( 岛 )- + (-i ) n+1 X) p ( 五 “ n) 

i=l / *=1 ii<ia<〜<in 

+ … — P{E\E^ - - - Bio) 

为了计算 卩瓜灰…艮」， 先注意到20个人坐成一圈，一共有19!种可能. 
(为什么?）对于指定的 n 对夫妇，在排位时，为使这 n 对夫妇坐在一起，先把这 n 
对夫妇中的每一对夫妇看成一个整体，这样，在排位时一共有20 - n 个对象，在圆 
桌上一共有 (20- n - l )! 种排位的方法，当排位确定以后，这 n 对夫妇之间又有排 
位问题，是男左女右还是男右女左.这样，将这 n 对夫妇排在一起的排位方法一共 
有 2 n (19 — n ) !种，我们得到 


再由命题 4.4, 可以得到至少有一对夫妇是坐在一起的概率为 

(\v 酈 - (\y 龉 + (w 謌 -.. .- 

所有的妻子都不坐在她丈夫旁边的概率大约为 0.339 5. ■ 

•例 5 o ( 游程）假设某个赛季过后，田径队的成绩为 n 胜 m 败.通过对这 
个输和贏的序列的研究，可望得到关于田径队的潜力的进一步的信息一种办法是 
研究输和贏的游程的规律.所谓贏的一个游程就是指贏的连续 序列. 例如，如果 
n = 10 ,m = 6,这个序列为 WWLLWWWLWLLLWWWW , 其中 W 为氣 L 为输. 
那么这里有4个贏的游程，第一个游程的大小为2,第二个游程的大小为3,第三个 
游程的大小为1,第四个游程的大小为 4. 

现在假定这个球队有《次鼠爪次输.假定所有的 (n + m )!/( n ! m !) 种次序 
是等可能的.我们希望求出球队输贏的序列具有 r 个贏的游程的概率.为此，考虑 
满足条件 I1 + ... + Xr = n 的正整数解 X !,---,!,所组成的 向童. 现在我们观察， 
有多少个输贏序列满足如下条件：⑴具有 r 个贏的游程， （ ii ) 第一个贏的游程的大 
小为 Xu ……，第 r 个贏的游程的大小为 av . 为此，我们令奶为第一个贏的游程 
以前输的次数， y 2 为第一个贏的游程与第二个贏的游程之间输的次数，……， yr +1 
为最后一个贏的游程后面输的次数.这些 1 A 满足 

2/1 + j/2 + ' • • + Vr+\ = 肌 1/1 彡 0 , y r +i ^ 0 , j/i > 0 , i = 2 , ••- , r 

这些 Xi, yi 与相应的序列可以用下列图形形象地表示： 
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现在可以数一数，对于固定的 xi ,---, x r , 相应输序列的个数为向量 （ yi ，… , i / r + i ) 
的个数，其中»1,••- , yr + l 满足前面所提到的约束条件.为了进一步计算输序列的 
个数，令 

1/1 = 1/1 + 1. Vi = Vi , * = 2, • - • , r , y r +i = y r +i + 1 
输序列的个数变成满足下列条件 

Si + V2 + • • • + y r +i = m + 2 

的正整数向量 ( yu ■■- , y r + i ) 的个数，在第1章命题 6 . 1 中，指出这个方程的正整数 
解的个数为 ( m + J ). 这样，具有个贏的游程的输贏序列的个数为(饥广 1 )乘 
以抑+ . •. + av = n 的正整数解的 个数. 再一次利用第1章命题 6.1 的结论，得到 
如下 结论： 具有 r •个贏的游程的输贏序列的个数为-由于我们假 

定 ( U t m ) 个输贏序列是等可能的，故 

P { 贏的游程的个数为 r } = ( m + 1 )(；： 1 1 )/( m ^' n ) r>l 

例如 ， n = 8 ，m = 6则具有 7 个贏的游程的概率为 /(^) = 1/429. 此处假 

设所有的个输贏序列是等可能的.现在假定这个队的输贏结果是 WLWLWL - 
WLWWLWLW . r = 7发生的概率很小，此时,我们可能会认为输贏的概率会随着时 
间变化，往往输球以后贏球的概率较大，而贏球以后输球的概率大.排球比赛中容 
易出现这种情况，因为贏球以后,保持了发球权,这样会给对方进攻的 机会. 另一方 
面，若输贏的结果是 WWWWWWWWLLLLLL , 此时，/"{贏的游程的个数为 1} = 
Q ( J )/( 1 g 4 )= 1/429. 这种情况下，我们就要怀疑球队的状况在下滑. ■ 

*2.6 概率： 连续集函数 

—列事件 { E n , n ^ l } 称为递增列，如果 

Ei C E2 C ■ ■ ■ C E n C E n +i C … 

反之，称为递减列，如果 

Ei D E2 D … D E n ] E n+ i D • • • 

如果 { E n , n >\} 是递增事件列，定义一个新的事件，记为 \^ E n , 如下： 

Um £„ = U 五‘ 
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类似地，如果 {E n ,n^l} 是递减事件列，那么定义 n lim E n , 如下： 

=pi 

现在来证明命题 6.1. 

命题 6.1 如果 {E n ,n>l} 是递增或者递减事件列，那么 
J^P^n) = Pilim^En) 

证明： 首先假设 {E n ,n>\} 是递增事件列，并且定义事件 F n (n ^ 1) 如下： 

n— 1 c 

Fi = Ei F„ = ^ U Ei\ = E n E^ l _ l n > 1 

\ i=l 

此处用到了 U^i 1 尽 = E n - U 也就是说 F„ 是由那些属于但是不属于玖 (i < n) 
的元素组成 . 显然，是一列互不相容事件.且满足 

0 巧 = [} & 以及 0 巧 = Cl & 对任意的 n > 1 

i=l t=l i=l *=1 

因此 

= p (0 Fi ) =£ p ( F< ) ( 利用公理 3 ) 

\x=l / \i=l / t=l 

=u 亡 p «)= „，„ p (0 H p (0 E ‘) = p ( 艮 ) 

i=l \i=l / M=1 / 

这样就证明了 {E„,n^l} 递增事件列时结论是成立的 . 

如果 1} 是递减的，那么 {£^,n^ 1} 是递增的，因此，根据上面结论 
可得到 

p (,Q Ef ) = — p(E；) 

由 可知 

p ((fjsy)=^^) 


1-p 



Ur^ll- P{E n )] = 1 - ^ P(E n ) 


等价地 




即 
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乂 Q 十， 。o 购 

这样就证明了当&为递减事件列的时候命题的结论也成立. 口 

例 6 a (概率与悖论）设想有个无限大的坛子，以及无限个编了号码 1,2,3... 
的球,进行以下的 试验： 

在12点差1分的时候，将1到10号球放进去，并把10号球拿出来（假设放 
球和拿球的时间忽略不 计)； 

在12点差1/2分的时候，将11到20号球放进去，并把20号球拿出来； 

在12点差1/4分的时候，将21号到30号球放进去，并把30号球拿出来； 

在12点差1/8分的时候，…… 

等等.问 题：在 12点的时候,坛子里有多少球？ 

问题的答案很明显 ： 12点钟的时候坛子里有无限个球.因为只要不是号码为 
10 n , n > 1的球，都将在12点前放进去，并且不会被取出来.因此，如果试验是这 
样进行的话，问题已得到了解决. 

现在换个 试验： 

在12点差1分的时候,将1到10号球放进去，并把1号球拿出来； 

在12点差1/2分的时候，将11到20号球放进去，并把2号球拿出来； 

在12点差1/4分的时候，将21号到30号球放进去，并把3号球拿 出来； 

在12点差1/8分的时候，…… 

等等.新的试验在12点钟的时候坛子里应该有多少球？ 

非常奇怪，答案是在12点的时候，坛子里一个球也没有.理由是，任何号码的 
球在12点前都将从坛子里取出，比如号码为 n 的球，在差 （1/2 广 - 1 到12点的时 
候被取出，因此，对于任意号码的某个球，在12点的时候都不可能在坛子里，这样, 
坛子就是空的. 

从上述讨论可以看出，取球的方式不一样会导致结果不 一样： 前一种情况，只 
有号码为 10 n , n > l 的球会被取出来,但在后一种情况下,所有的球都将被取出来. 
现在设想在取球的时候，是从当前所有球中随机取出， 也即： 

在12点差1分的时候，将1到10号球放进去，并随机取一个球 出来； 


等等.这种情况下，在12点时，坛子里有多少球？ 

解： 将要证明，在12点时坛子为空的概率为 1. 

首先考虑1号球， 定 XE n 表示在“进行 n 次取球后， 


号球仍在坛子里”这 


-事件.很 显然： 


P{En ) = 


9 -18-27- -(9«) 

10 -19-28- -(9« + 1) 
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注意到在经历 n 次取球后,如果1号球仍在坛子里，那么第一次取球有9种可 
能，第2次取球有18种可能（第二次取球的时候坛子里有19个球，其中有一个是 
1号球)，等等.这样，12点钟时，1号球仍在坛子里这一事件可以 写为： n~ =1 E n , 
E n (n ^ 1) 为递减事件列，根据命题 6.1 可知： 


P{12 点时1号球仍在坛子里} 
=P 


现在证明 

因为 

即等价于 证明： 


5严)'也 吼) '5 偽) 
n (^ r )-° 


n ( 0 °° 

因为，对任意 m > 1, 都有 


= { 1+ l){ 1+ h) ( 1 + 舂 ) ..( 1 + 忐 ) 

111 1 1 Al 

> 9 + 18 + 27 + '" + 9 ^ = 9^ 7 


因此，令 m — oo 且利用 ESi Vi = oo 可以得到 

n ( i+ ^) =o ° 

令只表示 “i 号球在 12 点时仍在坛子里”这一事件.前面已证明 P(Fi) = 0,类似地， 
可以证明对任意 i, P(Fi) = 0. (比如，同样的推理可以证明对任意 i = n ,\ 2 , ■■- ,20 
有 p { Fi ) = n^l 971 /^ + X )1 = °) -因此， 12 点时坛子非空的概率为 
利用布尔不等式（见自检习题I 4 ) 可得： 

彳 Ci +£ w)=o 

\»=1 / »=i 

因此，在12点时，坛子为空的概率为 1. _ 
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2.7 概率： 确信程度的度量 

本文曾 叙述： 一个事件的概率，是指在重复进行某个试验的情况下，对该事件 
发生频率的一种度量.然而，概率还有另外的用处.比如，我们经常听到这样的评 
论，“90%的可能是莎士比亚真地写了 《哈姆 雷特》”，“奥斯瓦尔德独自暗杀肯尼 
迪总统的可能性为80%”，这又作何解释？ 

最自然又简单的解释是，概率是人们对自己的说法的确信程度的一种度量，也 
就是说,前面的陈述者比较确信“奥斯瓦尔德是独立行动的”，而且更加确信“莎士 
比亚写了《哈姆雷特》”.概率作为个体确信程度的度量这种解释经常被称为主观 
概率 ( Subjective ). 

假设“确信程度的度量”满足概率的所有公理是很合情合 理的. 比如，如果我 
们有70%的把握认为是莎士比亚写了《凯撤大帝），而只有10%的把握认为作者 
是马洛，那么我们应该有80%的把握认为作者是莎士比亚或是 马洛. 因此,无论把 
概率解释为确信程度的度置，还是事件发生的频率，其数学属性是不改变的 • 

例 7 a 假设有7匹马参加比赛,而您认为1号马和2号马各有20%的机会获 
胜， 3 号马和4号马各有15%的机会，其余3匹各10%的机会.如果进行同等赌 
注的押赌，是赌“获胜者将是1,2,3号马之一”还是赌“获胜者将是1,5,6,7号马之 
一”更好？ 

解： 基于对比赛结果的主观认识，赌第-种贏的概 率是： 0.2 + 0.2 + 0.15 = 0.55, 
而第二种是 0.2 + 0.1 + 0.1 + 0.1 = 0.5, 因此，赌第一种更好. ■ 

应当指出，主观概率也应符合概率论的公理.但实际情况并非 如此. 例如，我 
们向某人了解对天气的看法时，经常提这样的 问题： 

( a ) 今天下雨的可能性是多少？ 

( b ) 明天下雨的可能性是多少？ 

( c ) 今明两天都下雨的可能性是多少？ 

( d ) 今天或明天会下雨的可能性是多少？ 

这个人经过考虑,很可能会给出下面的 答案： 30%,40%,20%,60%.显然，这样的回答 
与概率论的公理是相矛盾的.我们当然希望经过指出这种错误以后，这个人会修正 
他的回答，因为个人的看法不是精确计算出来的，是带有误差的.（一个可能可以接 
受的修 正是： 30%, 40%,10%,60%.) 


小 结 


如果令 S 为表示某个试验的所有可能结果的集合，那么 S 称为该试验的样本 
空间.一个事件就是 S 的一个 子集. 如果次 ， i =!,•••, n 为一系列事件，那么称 
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ur = iA 为这些事件的并，它表示至少包含在某一个次里的所有结果所构成的事 
件.类似地, ( Xi ^ i 称为这些事件的交,有时也记为 A 1 ---A n , 表示包含在所有烏 
里的所有结果所构成的事件. 

对任一 事件為定义#为由那些不包含在 A 里的所有结果所构成的事件，称 
为>1的对立事件.事件 S c 不包含任何结果，记为0，称为空集.如果儿 B = 0，那 
么称>1和 S 互不相容. 

设对于样本空间里的任一事件 A 对应于一个数 P{A), 若集合函数 P(A) 满足 
以下条件，则称为4的 概率： 

⑴0 < P(A) < 1 

( ii ) P ( S ) = 1 

( iii ) 对于任意互不相容事件> 1，有 

p(\J A )=fl P ^ 

\t=i / »=i 

P(A) 表示试验结果包含在事件>1里的概率. 

容易 证明： 

P(A C ) = 1 - P{A) 

一个有用的 结果： 

P(A U B) = P(A) + P(B)~ P(AB) 

可以推 广为： 

\i=l / i=l i<j i<j<k 

+ … +(-ir +i jp(u«) 

如果 s 是有限集，且其中每个结果发生的可能性是一样的，那么 


其中|五|表示事件£所含的结果数. 

P (, A ) 可以理解为频率的趋势或者相信程度的度量. 

习 题 

1. 一个盒子里有3个弹珠，红、绿、蓝各 一个. 先从中取出一个，再放回，然后再取出一个， 
试描述此样本空间.如果不放回呢？ 

2. 连续掷一枚骰子，直到6出现，试验停止，试描述此样本空间.令表示试验停止 
时，一共掷了 n 次”，那么样本空间里的哪些结果包 含在五 n 里？ En ) C 的含义？ 
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3. 掷两枚骰子，令 E 表示“骰子点数之和为奇数”，令 F 表示“至少有一个骰子点数为1” ； 
令 G 表示“骰子点数之和为5” . 试描述事件 £ F ， EUF,FG, £1^和 EFG. 

4. A , B , C 三人轮流掷硬币，第一次出现正面朝上者为胜.我们用0表示“正面朝下”，1表示 
“正面朝上”，样本空间可 写为： 



( a ) 试解释此样本 空间； （ b ) 表述以下亊件： 

0) A 胜了 (记为 A ); ( u)B 胜了 (记为 B ); ( Ui ) (AUB) C . 

在该试验中，假定 A 先掷, B 后掷，再 C 掷，接着又是 A 掷……循环往复. 

5. —个系统包含5个元件，每个元件有可能是好的，也有可能是坏的.用向纛（幻,；^,：^,:^, 
x 6 ) 表示各个元件的状态，其中心=1表示第 i 个元件是好的,3：, = 0表示第 i 个元件是坏 
的. 

( a ) 样本空间里一共有多少个结果？ 

( b ) 如果元件1和2是好的，或者元件3和4是好的，或者元件1，3和5都是好的，那 
么系统工作 正常令 W 表示系统工作正常，写出 W 包含的所有结果. 

(«0令表示元件4和5都是坏的，那么>1里一共有多少结果？ 

( d ) 写出亊件包含的所有结果. 

6. 医院管理系统对前来治疗的受枪伤病人进行编号，其依据为是否买了保险，如果买了保险， 
则记为1,否则记为0;还根据他们的身体状况，如果良好,就记为 S , 如果一般，就记为/, 
如果严重，就记为 

( a ) 给出试验的样本 空间； 

( b ) 令4 表示‘ ‘病人病情很严重”，列出4里的所有 结果； 

( c ) 令 B 表示“病人没有买保险”，列出 S 里的所有 结果； 

( d ) 列出亊件里的所有结果. 

7. 调査一个余足球队里15名球员的工作，是蓝领还是白领,还有政治关系，是共和党、民 
主党还是无党派 ，问： 

( a ) 样本空间一共多少结果？ 

( b ) “至少有一个队员是藍领”有多少结果？ 

( c ) “队员里没有人是无党派人士”有多少结果？ 

8. 设事件 A 和 S 互不相容，且 P{A) = 0.3, P{B) = 0.5, 求以下亊件的 概率： 

( a ) 或者 S 发生； （ b ) A 发生但 B 不 发生； （ c ) A 和 B 都发生. 

9. 某零售店既接受运通卡也接受维萨卡.它的顾客中有 24 %的人持有运通卡，61%的顾客 
持有维萨卡，11%的顾客持有两种卡，问至少持有一张卡的人数百分比. 

10. 某个学校60%的学生既不戴耳环，也不戴项链，20%的学生戴耳环，30%的学生戴项链. 
如果随机挑一个学生，求符合以下条件的 概率： 

( a ) 戴耳环或者项链_ ( b ) 既戴耳环也戴项链. 

11. 美国男性中有28%的人抽烟，7%的人抽雪茄，5%的人既抽烟也抽雪茄. 

( a ) 既不抽烟也不抽雪茄的人的百分比是多少？ 

( b ) 只抽雪茄但不抽烟的人的百分比是多少？ 
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12. 某个小学有三个语言班，一个是西班牙语班，一个是法语班，另一个是徳语班.这些语言班 
对学校里的100个学生开放.其中，有28人参加西班牙 语班； 有26人参加法 语班； 有16 
人参加徳 语班； 有12人既参加西班牙语班也参加法 语班； 有4人既参加西班牙语班也参 
加徳 语班； 有6人既参加法语班也参加德 语班； 另外，有2人三个班都参加. 

( a ) 随机选一名学生，他（或她）不参加任何班的槪率是多大？ 

( b ) 随机选一名学生，他（或她）恰好参加一个班的概率是多大？ 

(C) 随机选两名学生，其中至少有一人参加语言班的概率是多大？ 

13. 某个人口规棋为100 000的城镇有三份报纸 I 、 ii 和 III ,以下是对读报人群比例的调査 
结果: 

I : 10% ; I 和 II : 8%; I、II 和 III : 1%; 

II ： 30%; I 和 III : 2%; III : 5%; II 和 III : 4%. 

(比如，有8 000人读报纸 I 和 II ) 

( a ) 求出仅仅读 份 报纸的 人数； （ b ) 至少读两份报纸的 人数； 

( c ) 如果 I 和 III 是早报，而 II 是晚报，那么至少读一份早报和一份晚报的人数为多少？ 

( d ) 有多少人不读报纸？ （ e ) 有多少人仅读一份早报和一份晚报？ 

14. 对某份杂志的1 000名订阅者的调査给出了如下 数据： 考虑到他们的工作、婚姻和教 W 
状况，有312名专业人员，470名已婚人士，525名大学毕业生，42名大学毕业的专业人 
员，147名己婚大学毕业生, 86名己婚专业人员，25名己婚且大学毕业的专业人员.证明 
这些数据是不正确的. 

提 示：令 M , W 和 G 分别表示专业人员、已婚人士及大学毕业生的集合.假定随机地从这 
1000人当中选择一人,利用命题 4.4 来 证明： 如果上述数据是正确的，那么 P ( MJmjG )> 
1. 

15. 从52张牌里随机取5张，求以下亊件 概率： 

( a ) 同花（也即5张牌同一花 色)； 

( b ) 一对 （5 张牌为 a , a , b , c , d 形式（点数)，其中 a , b , c , d 各不相同)； 

( c ) 两对 （ 5 张牌为 a , o ,6,6, c 形式，其中 a . b . c 各不相 同)； 

⑷三张同点数 （5 张牌为 o , a , a ,6, c 形式，其中 a ,6, c 各不相 同)； 

( e ) 四张同点数 （5 张牌为 a , a , a , a , b 形式，其中 a , 6不相同). 

16. 同时掷5枚骰子，证 明： 

( a ) P { 每枚都不一样 } = 0.092 6; ( b ) P { —对 } = 0.463 0; 

( c ) P { 两对 } = 0.231 5; ( d ) P { 三面一样} = 0.154 3; 

⑷ P { 福尔豪斯} = 0.038 6; ( f ) P {4 枚一样 } = 0.019 3; 

( g ) P {5 枚一样 } = 0.000 8. 

17. 如果 8 个车随机地放在国际象棋棋盘上,求 没有一 对能互捉的概率，也即求任何一行或一 
列至多只有一个车的概率.（国际象棋盘有8 x 8 = 64格，棋子放在格内） 

18. 从一副洗好的扑克牌里随机挑两张，恰好配成“黑杰克”的概率是多大？（所谓“黑杰克”， 
也即其中有张 “ A ”， 另一张是10, *^”，“<3”，“1<”中任一张.） 

19. 两个同样的骰子，各有两面涂成了红色，两面涂成了蓝色，一面涂成了黄色，剩下一面涂成 
了白色.同时掷这两枚骰子，问出现同•种颜色的概率是多大？ 
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20. 假设某赡徒正在和庄家玩二十一点，对于一副洗好的扑克牌，赌徒和庄家都分不到“黑杰 
克”的概率是多大？（每人分配到2张牌） 

21. —个小型社区由20个家庭组成,其中只有一个小孩的家庭有4个，有2个小孩的家庭有 
8个，有3个小孩的家庭有5个，有4个小孩的家庭有2个，有5个小孩的家庭有1个. 

( a ) 如果随机选取一个家庭，它有 i 个孩子的概率是多大？ i = 1,2,3,4, 5. 

( b ) 如果随机选取一个孩子，孩子来自有 i 个孩子的家庭的概率是多大？ i = 1,2, 3,4,5. 

22. 对于 n 张扑克牌,有一种洗牌 技术： 对于任何一副没洗的牌,考虑第一张,掷一枚硬币，如 
果硬币出现的是正面，那么这张牌仍留原位，如果硬币是反面，那么将这张牌放到 最后一 
张，接着考虑第二张牌的位置变换，其规则与第一张牌的相同.硬币掷了 n 次后，就完成 
了一轮洗牌.比如，设 n = 4, 牌最初的顺序为1,2,3,4,如果硬币的顺序为正面、反面、反 
面、正面，那么最后牌的颓 序为： 1,4, 2,3. 假设所掷硬币是均匀的，且各次结果相互独立， 
问 经过- •轮洗牌后仍保持原来次序的概率有多大？ 

23. 同时掷两枚均匀骰子，问第二枚骰子的点数大于第一枚《子的点数的概率是多大？ 

24. 同时掷两枚败子，骰子点数之和为 i 的概率是多大？并求出 < = 2,3,... , li ,12 时的值 • 

25. 同时掷两枚骰子，直到骰子点数之和为5或者7出现，求和为5先出现的概率. 

提示： 令 E „ 表示第 n 次掷骰子出现和为5,但此前 n - 1次当中既不出现和为5,也不 
出现和为7,计算 P { E n ) 且证明 E~=i P (. En ) 就是题目所求概率. 

26. Crap 赌博规则 如下： 其中一人先掷两枚骰子，如果和为2,3或者12,那么他便 输了； 如果 
和为7或者11,那么他便贏了.如果和为其他，那么由他继续掷骰子，一直到第一次掷出 
的和数再次出现，或者出现和为 7. 若出现的是 7 ,则他输了，若出现的是第一次掷出的和 
数，则他贏了.求他赢的概率. 

提示 ：令拉 表示第一次掷殽子所得点数和为 f , 且取得了胜利.那么所求概率为 E . l i a 
P ( Ei ). 为了计算 P (玖)，定义表示事件“第—次和为 i 且在第 n 次取得了胜利”. 
证明 P ( Ei ) = P { Ei , n ). 

27. 坛子里有3个红球和7个黑球，玩家和 B 从坛子里交替拿球，直到有人拿到了红球， 
求4取到了红球的概率.（假设4先取球，然后 S 再取，接下来又是 A 取，等等，并假释 
球取出来后不放回 •） 

28. —个坛子里有5个红球、6个蓝球和8个绿球.如果随机取3个球，问以下事情的概率： 
( a ) 三个球同.种 颜色； ( b ) 三个球不同的颜色. 

假设取球后，记下其顔色，然后再放回坛内1这就是所谓的有放 回柚样 (Sampling 
with relacement )], 重新计算以上事件的概率. 

29. 坛子里有 n 个白球和 m 个黑球，其中 ri 和 m 都是正败. 

( a ) 随机取两个球，问它们是同一种额色的概率？ 

( b ) 从坛子里随机取一个球，然后放回再第二次取球，求取出的两个球颜色相同的概率. 

( c ) 证明 （ b ) 的概率始终大于 （ a ) 的概率. 

30. 两所学校的棋类俱乐部分别有8和9名棋手，每个俱乐部各随机选4名参加两校间的对 
抗赛.选出来的棋手随机地和另一俱乐部选出来的棋手进行两两配对下棋,假设丽贝卡和 
妹妹埃莉斯分别在这两校的棋类俱乐部，求以下亊件的 概率： 
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( a ) 丽贝卡和埃莉斯正好配成一对 .（ b ) 丽贝卡和埃莉斯都被选出，但是她们不 下棋； 

( c ) 她俩人只有一个被选出代表学校参赛. 

31. -个3人篮球队包括1个后卫，1个前锋，1个中锋. 

( a ) 如果从3个这样的篮球队里分别选 一人， 正好可以组成一个新篮球队的概率是多大？ 

( b ) 选出来的3人是打同一位置的概率是多大？ 

32. 一个小组有6个男孩, 9 个女孩，按随意顺序站成一择，即（6 +州种排列中任一种都是 
等可能的，试问，第 i 个位置 ( l ^ i^b + g ) 站的正好是女孩的概率. 

33. 树林里有 2 0只麋鹿，捉住其中5只，貼上标签，然后再放回.一段时间后，再捉住4只糜 
鹿.其中有两只貼了标签的概率是多大？此处做了什么样的假设？ 

34. 据报道， Yarborough 二世曾经用1000比1的赌注打赌一个桥牌手里的13张牌里至少有 
一张牌是10或者更大（所谓更大意味着是10,或者 “ J ”,“ Q ”,“ K ”， 和 “ A ”). 如今，一手 
牌里如果没有一张10以上的牌，就称为 Yarborough . 问随机发的-.手牌是 Yarborough 
的概率是多大？ 

35. 一个坛子装有12个红球，16个篮球，18个绿球.从中随机地取出7个球.求出下列亊件 

的概率. 

( a ) 抽出3个红球，2个蓝球，2个 绿球； 

( b ) 其中至少有2个 红球； 

( c ) 抽出的球的颜色全 相同； 

( d ) 抽出的球中恰有3个红球或者恰有3个 K 球. 

36. 从52张牌里随机取2张,求以下亊件 概率： 

⑷都是 “ A ”； （ b ) 点数相同. 

37. 老师给班里学生留了 10道习题，并且告诉他们期末考试就是从中随机选择5道，如果有 
个学生解出了其中7道,求以下亊件 概率： 

( a ) 他（她）能解出所有的 5 道考 试题； （ b ) 至少能解出其中4 道. 

38. 抽屉里有 n 只袜子，其中3只红的.如果随机取两只袜子，同为红色的概率为1/2,试问 
n 为多大？ 

39. 城镇里有5个旅馆，某天有3人入住旅馆，问正好住进不同旅馆的概率是多大？其中做了 
什么样的假设？ 

40. 城镇里有4人修理电视机，现在有4台坏电视机，问正好有= 1.2, 3, 4) 人被要求参与 
修理的概率？其中做了什么样的假设？ 

41. 掷一枚骰子4次，至少出现一次6的概率是多大？ 

42. 连续掷两枚骰子 n 次，计算双6至少出现一次的概率.要想此概率大于或等于1/2, n 至 
少要多大？ 

43. ( a ) 包含 A 和 B 在内的 iV 个人随机的排成一排，问 A 和 B 紧挨着的概率是 多大； 

( b ) 如果是随机的排成一圈，那么这个概率是多大？ 

44. 有 A , B , C , D , E 五人,站成一排，假设每种顒序都是等可能的，求以下事件 概率： 

( a ) A 和 B 之间恰好有一 个人； （ b ) A 和 B 之间恰好有两 个人； 

( c ) A 和 B 之间恰好有三个人. 

45. 有位妇女有 n 把钥匙，其中有一把能打开房门. 
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( a ) 她随机地用钥匙开房门，如果打不开，就换一把钥匙（钥匙不重复试用)，请问正好在 
第 A ： 次成功打开房门的槪率是多大？ 

( b ) 如果钥匙可重复试用，这时 （ a ) 中问题的概率是多大？ 

40. 需要多少人，才能保证其中至少有两人同一月份过生日的概率大于1/2?假设每个月的可 
能性是一样的. 

47. 房间里有12个人,求没有两人在同一月份出生的概率. 

48. 有20人，求如下亊件的概率：12个月当中，其中4个月毎月均有2人过生日，而另有4 
个月每月均有3人过生曰. 

49. 6个男人、6个女人随机地分成2组，每组6人,求两组的男人数正好一样的概率. 

50. 在桥牌比赛中，计算你有5张黑桃，而搭档正好有8张黑桃的概率. 

51. n 个球随机地放到 JV 个房间，设 AT 种结果每种都是等可能的，试求第一个房间恰有 m 
个球的概率. 

52. 衣柜里有10双鞋，随机拿8只，问如下亊件的 概率： 

( a ) 一双鞋都 没有； （ b ) 正好有一双鞋. 

53. 如果4对夫妇坐成一排，试求没有夫妇坐在一起的*率. 

54. 计算桥牌比赛中有一家至少缺一套花色的概率.此答案并不是为什么？ 
提示：利用命题 4.4. 

55. —手牌13张,求以下亊件概率： （ a ) 有同花色的 “ A ” 和 “ K -; ( b > 有同点数的四张. 

56. 有两人玩以下 游戏： A 从图 2.6 中所示的三个轮盘中选择 -- 个，然后 B 在剩下的两个中 
选择-•个.接着两人分别转动各自选中的轮盘，轮盘最后所停的位置下方区域里的数宇大 
者获胜.假定每个轮盘停在三个区域是等可能的.如果是你，你会选择是 A 还是 B ? 并解 
释原因. 



图 2.6 习题56图 


理论习题 

1. 证明： EFcEdEUF . 

2. 证明：如果五 C 那么 F 0 C 

3. 证明 ： FsFSUfP 和 EUF = EUETF . 

4 . 证明：以及 
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5. 对任一系列事件 EuE ^， …， 定义一列丽不相交事件 R ，丹 ，…(如 i 呉 j 则 FiFj = 0) 
使得对任何 n >1有 

y ^= u ^ 

6 . 设 E , f , G 为三个事件，写出如下亊件的表 达式： 

( a ) 仅仅 B 发生； （ b ) E 和 G 都发生，但 F 不 发生； （ c ) 至少有一个亊件 发生； 

( d ) 至少有两个亊件 发生； （ e ) 三个亊件都 发生； （0 —个事件都不 发生； 

( g ) 最多一个事件 发生； ( h ) 最多两个事件 发生； （ i ) 正好两个事件 发生； 

( j ) 最多三个亊件发生. 

7. 化简下列表 达式： 

( a ) ( EUF ){ EUF °)-, ( b ) (E U F ^ E 0 U F)(E U r 1 )-, ( c ) (£ UF )( FUG ). 

8 . 给定集合 S , 如果存在一列互斥非空子集 Si , S 2 , -- ，灸 (fc > 0)，满足 UJU & = S , 那么 
称…， S *} 为5的一个分割 ( partrtion ). 令 T " 表示集合 {1,2 •…， n } 的不同分 
剌的总数，因此，2\ = 1( 表示仅仅一个分割 ft = {1}), T a = 2( 表示两个 分割： {{1,2}} 
和 

( a ) 证明 ： Ta = 5,7 i = 15. 

( b ) 证明： 

T„ + i = l + f ：(；)^ 

k=l 

并利用此公式计算 7\ 0 . 

提示： 在 （ n +1) 个元索中选定-个元索，称为特殊元索.并将分割 分类： 分割中含有这 
个特殊元索的子集称为这个分割的特殊子集.具有相同特殊子集的分割形成一子类，再将 
每•个子类所含分割数加起来，就得到 T n + x . 

9 . 设 一 个试敢的样本空间为将试验重复 n 次,对样本空间 S 里的任一亊件令 n ( B ) 
表示 n 次亊件中 E 发生的次数，定义 f ( E ) = n (£)/ n •证明 /(.) 满足公理1, 2, 3. 

10. 证明： P ( EUFUG ) = P ( E ) + P { F ) + P ( G )- P ^ FG ) - P ^ EF ^ G ) - P ^ EFG 0 ) - 
2 P ( EFG ). 

11 . 如果 P ( E ) = 0.9, = 0.8, 证明 P ( EF ) ^ 0.7. 更一般地，证明 Bonferroni 不 等式： 

P ( EF ) > P ( B ) + P ( F ) - 1 

12 . 证明： £ 和 F 恰好只有一个发生的概率为 P (. E ) + P { F )~ 2 P { EF ). 

13. 证明: PiEr 1 ) = P ( E )~ P ( EF ). 

14. 用数学归纳法证明命题 4.4. 

15. —个坛子里有 M 个白球和 iV 个黑球，随机取 r 个，问恰好取到 fc 个白球的概率是多少？ 

16. 将 Bonferroni 不等式推广到 n 个事件的情形，也即 证明： 

P { EiE 3 - En )^ P ( Ei ) + ••• + P ( E n ) - (n - 1) 

17. 考虑例 5 m 中的匹配问题.令表示 N 个人都不选自己帽子的方法数，播出 

An = (N — l )( i 4 w_i + An - i ) 
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结合边界条件 A l = 0 , A a = l 可以递推地求出 A w . 最后，没有人拿到自己帽子的概率 
为 An / NI . 

提示： 可将； V 个人都不选自己帽子的方法分类，指定其中一个人，称为“老王”，老王选 
定了一顶别人的帽子，这样就把选帽子的方法按老王选定的帽子的不同分成 （JV - 1) 类, 
设老王选定了另一个人（老张）的帽子，现在有一个特殊的人（老张，他己经没有自己的帽 
子可选)，以及一个特殊的帽子（老王的帽子)，再将_下的 AT - 1人都不选自己帼子的方 
法分成两类，一类是特殊人选了特殊的 帽子， 一类是特殊人不选特殊的帽子，分别计算两 
类中的方法数，就可以导出所得的公式. 

18. 令/„表示掷一枚硬币 n 次且从不出现连续正面的可能结果数， 证明： 

fn = fn-l + / n -2 Tl ^ 2 , 其中 /(} = 1, /l =2 
提示： 按第一次掷硬币的结果将可能的试验结果分成两类，一类是反面朝上，另一类是正 
面朝上，分别对两类结果计数.若表示 n 次掷硬币的结果中不会连续出现正面的概 
率，在掷 n 枚硬币的各种结果为等可能情况下，找出与/„之关系，并计算 P l0 . 

19. —个坛 子里有 n 个红球， m 个藍球，从中一个一个取球，一直到取了 r(r < n ) 个红球为 
止.求此时正好取出 fc 个球的概率是多少？ 

提示： 正好取出 A ： 个球等价于第 fc 次取出红球且前 fc - 1次取出 r - 1个红球. 

20. 设有一个试验，其样本空间包含可数个结果，试证明不可能所有可能结果发生的概率都一 
样.有没有这样的可 能性： 所有的可能结果发生的概率均为正数？ 

*21. 在例50中，讨论了在 n 次贏和 m 次输的次序是随机的情况下，关于贏的游程的数目的 
概率计算问题.现在考虑全部游程的个数（贏的游程的数目加上输的游程的数目)， 证明： 

d;) 

P {2 fc 个游程 } = 2- 

(T) 


P {2 fc + 1个游程 } = 


m 


自检习题 

i . 咖啡馆有主菜、主食和甜点三道供餐，可能的选择 如下: 


种类 

选择 

主菜 

鸡肉或烤牛肉 

主食 

面、米饭或土豆 

甜点 

冰淇淋、果冻、苹果酱或桃子 


客人在每个种类中选择一种. 

( a ) 样本空间里一共有多少个结果？ 
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( b ) 令4表示“选择冰淇淋”，4里一共有多少结果？ 

(C) 令 B 表示“选了鸡肉”， B 里一共多少结果？ 

( d ) 列举事件 AS 里所有 结果； 

( e ) 令 C 表示“选了米饭”， C 里一共有多少结果？ 

( f ) 列举事件 ABC 所含的所有结果. 

2. 时装店里来了一位顾客，已知他买西装的概率为 0.22, 买衬衫的概率为 0.30, 买领带的概 
率为 0.28, 既买西装又买衬衫的概率为 0.11, 既买西装又买领带的概率为 0.14, 既买衬衫 
又买领带的概率为 0.10, 三者都买的概率为 0.06. 求以下亊件的 概率： 

( a ) —样都 不买； （ b ) 正好买一样. 

3. 随机发一副牌，第14张是 “ A ” 的概率是多少？第14张才出现 “ A ” 的概率又是多少？ 

4. 令>1表示“洛杉矶的城中气温为 70° F ” ，令 S 表示“纽约的城中气温为 70° F ” ，再令 
C 表示“洛杉矶和纽约的城中气 M 较髙者为 70° F ” . 如果 P { A ) = 0.3, P ( B ) = 0.4, R 

= 0.2, 求“洛杉矶和纽约的城中气溫较低者为 70° F ” 发生的概率. 

5. 一副洗好的牌共52张，求最上面4张是以下情况的概率： （ a ) 不同 点数； （ b ) 不同花色. 

6 . 坛子 A 里有3个红球和3个黑球，而坛子 B 里有4个红球和6个黑球，从两个坛子里 
各取一球，正好是同一种颜色的概率是多少？ 

7. 某个州发行一种彩票，彩民要从1到40个数里选8个.最后，组委会也从这40个数里 
选8个作为中奖数字，假定种结果都是等可能的，求以下亊件的 概率： 

( a ) 彩民猜中了 8个 数字； （ b ) 彩民猜中了 7个数宇； （ c ) 彩民至少猜中了 6个数字. 

8. 从3名-•年级新生、4名二年级学生、5名三年级学生、3名毕业班学生里随机选择4人 
组成委员会，求以下亊件 概率： 

( a ) 委员会中每个年级恰好一 个人； 

( b ) 委员会由两个二年级学生和两个三年级学生 组成； 

( c ) 委员会仅由二年级或三年级学生组成. 

9. 对于有限 集木令 N ( A ) 表示集合4里元素的个数. 

( a ) 证明: N(A UB ) = N ( A ) + N { B ) - N ( AB ) 

( b ) 更一般地， 证明： 

^(0^) 况⑷） -HT, N ( A * A i) + … + (-l) n+， N(A, … A„) 

\ i=l / i i<i 

10. 赛马比赛中有 6 匹马，编为 1, 2, 3, 4, 5, 6 号.样本空间由6!种可能的比赛结果组成. 
令 A 表示“1号马跑在前3名”，令 S 表示 “2号马跑第二名”，那么>1 U B —共包含多 
少个结果？ 

11. 从一副洗好的52张牌里取5张，每个花色至少有一张的概率是多大？ 

12. 篮球队有6名前场队员和4名后场队员，现在要随机两两配对分宿舍.问正好有两间宿_ 
舍由前场队员和后场队员合住的概率是多大？ 

13. 某人从 “ RESERVE ” 中随机挑选一个字母，再从 “V E R T I C A L " 中选一个，求 
两个字母恰好相同的概率. 



14. 证明布尔不 等式： 

p ( m a, ) ^ S p(a °' 

15. 证明： 如果 P ( Ai ) = 1对任 一 i > 1成立，那么 P (flSi A *) = L 

16 . 令 T *( n ) 表示“集合 {1, ••,«} 分成 fc 个非空子集的不同分割数”，此处1彡 fc < n (分 
割的定义参见理论习题 8), 证明： T t ( n ) = kT k {n - 1)+ T fc _ i(n - 1) 

提示： {1} 是子集的分割数是多少？ {1} 不是子集的分割数是多少？ 

17. 一个坛子里装有5个红球, 6个白球和7个蓝球，无放回地随机抽取5个，三种颜色的球 
都取到的概率是多大？ 

18. 将4个红球, 8个蓝球和5个绿球随机地排成 •行 • 

( a ) 前5个球为蓝色的概率有多大？ 

( b ) 前5个球中 没有® 色球的概率有多大？ 

( c ) 最后3个球为三种不同颜色的概率有多大？ 

( d ) 所有红球连在一起的概率有多大？ 

19. 在一副52张扑克牌中随机地抽出10张牌.将抽出的牌按其花色分成四堆. 

( a ) 各堆中张数分别为4, 3, 2, 1的概率有多大？ 

( b ) 其中两堆各有3张牌，还有一堆有 4 张牌的概率有多大？ 

20 . 设 一 坛子中有20个红球，10个蓝球.现在随机地一个-个地从坛子中取出.求红球比蓝 
球先取完的概率. 



第 3 章条件概率和独立性 

3.1 简 介 


本章，我们将介绍概率论中最重要的概念 之一： 条件概率.此概念的重要性在 
于两 方面. 一方面，我们在计算某些事件的概率时，同时具有某些关于该试验的附 
加信息,此时概率应该是条件 概率. 另一方面，即使手头没有附加信息，也可以利用 
条件概率的方法计算某些事件的概率，而这种方法常使计算变得十分简单. 


3.2 条件槪率 

同时掷两枚骰子，并假设36种结果都是等可能发生的，因此每种结果发生的 
概率为 1/36. 进一步假设已知第 • 枚 骰子点数为3,在这些条件下两枚敢子点数之 
和为8的概率是多大？为了计算这个概率，解释 如下： 既然第一枚敗子点数为3,那 
么掷两枚骰子一共有6种可能 结果： (3,1), (3,2), (3,3), (3,4), (3,5), (3,6). 因为每个 
结果发生的概率都一样，那么，这6种结果也应该是等可能的，即在给定第一个骰 
子为3的情况下，下面6种 结果： (3,1), ••- ,(3,6), 每一个结果发生的（条件）概率 
应该是1/6,而样本空间中其他30个点的（条件）概率应该是 0. 这样,在第一枚骰 
子点数为3的条件下，两枚敢子点数之和为8的概率应该是 1/6. 

如果令£和 F 分别表示“两枚般子点数之和为8”和“第一个敗子点数为3”， 
利用上述方法，计算得到的概率称为假定 F 发生的情况下发生的条件概率，记 
为 


P ( E \ F ) 

用如下方式可以推导出一个对于所有五和 F 都适用的计算 P ( E \ F ) 的常用 公式: 
如果 F 发生了，那么为了 S 发生，其结果必然是既属于£；也属于疋即这个结果 
必然属于五厂既然己知 F 已经发生, _F 成了新的样本空间，因此发生的（条件) 
概率必然等于发生的概率与 F 发生的概率之比值.因此，有如下定义. 


定义如果 P ( F ) > 0,那么 


㈣ =鬻 

(2.1) 
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邮 

电 


例 2 a 某个学生参加一个时限为1小时的测验.假定对任意0 < a : < 1来说， 
他在： r 小时内完成测验的概率为 z /2, 己知 0.75 小时后他仍在答题，问他最后要用 
光一小时的条件概率是多少？ 

解：令 表示“学生完成测验的时间不超过: r 小时 （0 < a : < 1)” ，令 F 表示 
“学生用光了 1小时”.因为事件 F 就是“学生完成测验时间超过1小时”，因此 


P ( F ) = P ( L c t ) = 1 - P ( Lj ) = 0.5 

因为事件 “0.75 小时后学生仍在答题”就是事件“学生完成测验时间超过 0.75 小 
时”，可记为 L §. 75 , 因此所求概率为 

P { FLl _ n ) _ P ( F ) 0.5 
- P ( Lg . 75 ) _ 1 - P(Lo.7 5 ) ~ 0.625 


P(F|LS.75) = 


= 0.8 


若有限样本空间 S 中， 每个 试验结果是等可能的，那么当以 S 的子集 f 作 
为条件时， 所有 F 中的结果也都是等可能的.因此在计算条件概率时，可将 F 作 
为样本空间，用压缩了的样本空间通常使计算变得简单，概念也容易理解.下面几 
个例子就说明了这点. 

例 2 b 抛掷一枚硬币两次，假定样本空间 5={( H , H ),( H , T ),( T , H ),( T , T )} 中的 
四个样本 点发生 的可能性是-•样的，求给定以下事件后两枚硬币都是正面朝上的条 
件概率： （ a ) 第-•枚正面朝上 .（ b ) 至少有-•枚正面朝上 • 

解：令 J 5={( H , H )} 表示事件“两枚硬币都是正面朝 上”； 令 F ={( H , H ),( H , T )} 
表示事件“第一枚硬币正面朝 上”； 令 4={( H , H )，( H ， T ),( T , H )} 表示事件“至少有 
一枚硬币正面朝上”.那么 （ a ) 的所求概率为 


P { B \ F ) = 


"PCFf P ({( H , H ),( H ) T )}) _= 274 = 


P { BF ) 


P ({( H , H )}) 


1/2 


对于 （ b ), 有 

尸(姻 P{BA) - 哪， H )» _= 1/1 = 1/3 

明 A 卜 P ( A ) P ({( H , H ),( H , T ),( T , H )}) 3/4 ' 

因此,己知第一枚硬币正面朝上的条件下，两枚硬币都是正面朝上的条件概率为1/2, 
而已知至少一枚硬币正面朝上的条件下，两枚硬币都是正面朝上的概率为1/3•很 
多学生对后者感到吃惊,他们认为至少有一枚正面朝上这个事件有两种可能性，两 
枚都正面朝上和只有--枚正面朝上，他们的错误是把这两种情况看成等可能的了. 
事实上，“至少一面朝上”这个事件包含了 3 个 结果： （ H ， H ),( H , T ),( T , H ). 而这三种 
结果都是等可能的，而 ( H . H ) 只是其中一个结果，因此其条件概率为1/3是很自然 
的了. ■ 

例 2 c 桥牌游戏里，52张牌平均发给东、西、南、北四家.如果南和北一共有 
8张黑桃 ，问： 东有剩下5张黑桃里的3张的概率是多大？ 

解： 最简单的方法是缩减样本空间.也即，已知南北26张牌中共有8张黑桃， 
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那么还剩下26张牌,其中正好5张是黑桃,将要分给东西两家.由于每种分法都是 
等可能的，因此，东家13张牌中正好有3张黑桃的条件概率是 


©(M) 湖 9 


例 2 d —个坛子里有 r 个红球和6个蓝球，随机地从中无放回地依次取出 n 
个球 （ r » <r + 6). 已知其中 fc 个是蓝球，问第一个球是蓝球的条件概率是多大？ 

解： 如果我们设想所有的球都标了号,其中蓝球标有1到6号，红球标有6 + 1 
到6+ 7•号.那么从 n 个球中无放回地取 n 个球的结果就对应一个分量各不相同 
的向量〜，■••，〜，其中任一〜的取值介于1到 r + 6 之间.假设结果为任何一个 
向量的可能性是一样的.因此，己知向量包含 fc 个蓝球（也即，包含了 1到6之间 
的 fc 个值）条件下，各个结果都是等可能的.在选中的 n 个球中（其中 fc 个球为蓝 
球)，由于任何一个球被第一次选中的可能性都是一 样的. 因此,所求概率为 fc / n . 

如果我们不选择缩减样本空间，可以这样 解决： 令 B 表示“第一次取球为蓝 
球”这一事件,而 S * 为 “ n 个球中含 fc 个蓝球”这一事件，那么 


P ( B \ B k ) 


P { BB k ) 

~P(BkT 


P ( B k \ B ) P { B ) 

~ Wk )- 


现在， P ( B k \ B ) 为如下事件 概率： 随机从装有 r 个红球, 6 - 1 个蓝球的坛子里随机 
抽取 n - 1个球,正好有 fc - 1个 蓝球. 这样， 

侧 mj/m 1 ) 

利用上述结论，以及 P ( B ) = ^和超几何概率 P ( B k ) = G )( n ： J /( r n b )> 
可得结果 P ( B \ B k ) = k / n . ■ 

在 （2.1) 式两边同时乘以 P ( F ), 可以得到 

P { EF ) = P ( F ) P { E \ F ) (2.2) 

也就是说，公式 （2.2) 说明了 £和 F 同时发生的概率，等于 f 发生的概率乘以 F 
发生的条件下 S 发生的条件概率•公式（ 2 .2)在计算事件的交的概率时非常有用. 

例 2 e 为选修法语课还是选修化学课这件事，茜琳犹豫不决.她估计如果选修 
法语课，则获得“ A ” 等成绩的概率为1/2,而如果选修化学课，则获得“ A ” 等成绩 
的概率为 2/3. 如果茜琳通过掷硬币来作决定，问她将选修化学课，并获得 “ A ” 等 
成绩的概率是多大？ 

解：如果令 C 表示“茜琳选修化学课”，而乂表示“她获得了 ‘ A ’ 等成绩”， 
那么所求概率为 P ( CA ), 利用公式 （2.2) 计算如下： 

P { CA ) = P { C ) P ( A \ C ) = ^ x | = i ■ 

例 2 f 坛子中有8个红球与4个白球，现在顺序地无放回地从坛子中取出两 
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个球 .（ a ) 假定每次抽取时，坛子中各球被取中的可能性是一样的，问取出的两个球 
都是红球的概率是多大？ （ b ) 假定坛子中各个球有不同的权数，每个红球的权数为 
r , 每个白球的权数为坛子中一个球被抽出的概率等于这个球的权数与当时坛 
子中全体球的权数之和的 比值. 现在问顒序抽出的两个球都是红色的概率有多大？ 

解：令 拓和 fl 2 分别表示第一次与第二次取出红球的事件.若取出的第一个 
球是红球，那么坛子中剩下7个红球4个白球,因此, P ( R ^ Ri ) = 7/11.由于 P ( fli ) 
显然等于8/12,所求概率为 P ( RiR 2) = P { Ri ) P ( R 2\ Ri ) = (2/3) (7/11) = 14/33•当 
然，这个概率也可由公式 P ( RiR 2) = (^)/^) 算出. 

至于 （ b )， 我们还是令 ft 为第 i 次抽得红球这一事件，并利用公式 


PiRM = P(Ri)P(R2\Ri) 

进行计算.现在将红球进行标号,并且记 Bi 为“第一次抽得红球 i ” 这一事件，这样 
P{Ri) = P (y B *) = E = 8TT4^- 

再者，当第一次抽得红球以后，坛子里只剩下7个红球和4个 白球. 与前面的论证 
相似，我们得到 


这样,两次抽得红球的概率是 




8 r 

Sr + 4w 


7 r 

7 r + 4 u / 


公式 (2.2) 的推广有时也称为乘法规則，它提供了任意个亊件交的概率的计算 


桃一 _ 

I 乘法规则 

P{ExE 2 E z •••£；„) = P(gi)P(E 2 |g 1 )P(g 3 |gig2) ••- PjEnlE! - - - E n -i) 


为了证明乘法规则，对等式右边利用条件概率的定义，可得 


TO ) 




例 2 g 在第2章例 5 m 的“配对问題”中已经指出， AT 个人都没有拿到自己 
的帽子的概率仏由下式给出 

«=o 

现在的问题是： N 个人中恰有 fc 个人拿到自己的帽子的概率是多少？ 

解： 现在在 iV 个人中选定 fc 个人,求出这 fc 个人拿到自己的帽子但其他人都 
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没有拿到自己的帽子的概率 .记五 为事件“这 fc 个人拿到自己的帽子”， G 为事件 
“其余 N - k 个人都没有拿到自己的帽子”.利用条件概率的定义， 

P ( EG ) = P { E ) P { G \ E ) 

现在记巧为事件“这个子集合中第 i 个人拿到自己的帽子 ”， i = 1， . • • ， / t . 利用乘 
法规则得到 


P { E )= P ( F l F 2 - F k ) 

= P (巧)/>(朽|巧)/>(巧|巧丹)… P { F k \ F x ■■- Fta ) 

11 1 1 (N - A :)! 

= N"N^i"N^2"~N-k + l = ~m~ 

己知这 fc 个人拿到自己的帽子的条件下，其余 AT - fc 个人就随机地从这 N-k 个 
帽子中选择帽子.这样，问题就转化为 W - Jfe 个人都没有拿到自己的帽子的计算问 
题.因此 

N-k 

P(G|E) = PA,_ fc = 53(-l)V*! 

«=o 

这样， A : 个特定的人拿到自己的帽子，而其余的人没有拿到自己的帽子的概率为 
P ( EG ) = { JLz ^ lp N _ k 

而“恰有 fc 个人拿到自己的帽子”的事件发生的充要条件是“其中某 Ifc 个人拿到 
自己的帽子，但其余的人都没有拿到自己的帽子”的发生.这样 

P (恰有 fc 个人拿到自己的帽子 )= O P ( G \ E ) = P N - k / k \ 

we " 1 /*! (N 很大时） ■ 

现在我们利用乘法规则得到第2章的例 5 h ( b ) 的第二种解法. 

例 2 h —副52张牌随机地分成4堆,每堆13张.计算每一堆正好有一张 “ A ” 
的概率. 

解： 定义事件 Ei,i = l ,2,3,4 如下： 

£i = { 黑桃 “A” 在任何一堆里 } 

E 2 = { 黑桃 “A” 和红桃 “A” 在不同的堆里 } 

£； 3 = {黑桃“人”，红桃“八”和方块“八”在不同的堆里} 

五4 = {4张“人”在不同的堆里} 

所求概率为 P ^ EhEsEi ), 利用乘法规则， 


PiE^EaE^ = PiE^P^E^PiE^EiE^P^E^Ez) 

由于玢为样本空间 S , P ( E !) = 1,红桃 “ A ” 可以在黑桃 “ A ” 这一堆，也可分在其 
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余3堆中.红桃 “ A ” 分在其余3堆的可能性为 P ( E 2\ Et ) = 39/51. 方块 “ A ” 可以分 
在黑桃 “ A ” 或红桃 “ A ” 这些堆里，也可分在其余的两堆里.分到其余两堆的可能性 
为 P ^ Ez ^ Eh ) = 26/50. 梅花 “ A ” 可以分在黑桃 “ A ”， 红桃 “ A ” 或方块 “ A ” 这些堆 
里，或者分在另外一 堆里. 方块 “ A ” 在另外一堆的概率为 PiE ^ E ^ Ea ) = 13/49. 
因此,我们可以得到所求的每堆恰好有1个 “ A ” 的概率为 


P^EiEsEt) 


39 x 26 x 13 
51 x 50 x 49 


« 0.105 


也即，大概有10.5%的机会每堆牌中恰好有一个 “ A ” （习题13将利用乘法规则给 
出另一种解法). ■ 

注释 P ( E \ F ) 的定义与概率的频率解释是一致的.假设我们进行了 n 次独立 
重复试验 （《 相当大).若我们只考虑事件尸发生的那些试验，此时 P ( S | F ) 近似地 
等于亊件发生的相对频率.由于概率 P ( F ) 是事件 F 发生的频率的极限，在 n 
次独立重复试验中，事件 F 会近似地发生 《 P ( F ) 次.类似地，事件会近似地 
发生 nP ( EF ) 这样，在 F 发生的近 nP ( F ) 次试验中，事件£也发生的相对频 
率近似地等于 nP ( EF )/ nP ( F ) = •当 n 越来越大时，其相对频率趋 

于 P ( EF )/ P { F ). 这个值也就是 P ( E \ F ) 的频率 定义. 因此，从概率的频率解释来 
看 （2.1) 式关于条件概率的定义也是合理的 • 


3.3 贝叶斯公式 


令£和 F 都表示 亊件. 可以 
将表示为 E = EF \ JEF C 这样, 
E 里的结果，要么同时属于£和 
F , 要么只属于但不属于 F (见图 
3.1). 显然,和 EF ^ 是互不相容 
的，因此,根据公理3可得 


P ( E ) = P ( EF ) + PiEF ^) 

= P ( E \ F ) P ( F ) + P ( E | F C ) P ( F C ) (3.1) 

= P ( E \ F ) P ( F ) + P ( g | F°)【l - P ( F )] 

公式 （3.1) 说明了事件 £ 发生的概率，等于在 F 发生的条件下五的条件概率 
与在 F 不发生的条件下五发生的条件概率的加权平均，其中加在每个条件概率上 
的权重就是作为条件的事件发生的概率.这是一个非常有用的公式，它使得我们能 
够通过以第二个事件发生与否作为条件来计算第一个事件的 概率. 也即，在许多问 



图 3.1 深灰 

色区域;£厂=浅灰色区域 
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题中，直接计算某个事件的概率是非常困难的,但是一旦知道第二个事件发生与否, 
就容易计 算了. 我们接下来用一些例子阐述这点. 

例 3 a (第1部分）保险公司认为人可以分为两类，一类为容易出事故者,另一 
类则为安 全者. 他们的统计表明，一个易出事故者在一年内发生事故的概率为 0.4, 
而安全者,这个概率则减少为0.2,若假定第一类人占人口的比例为30%,现有一个 
新的投保人来投保，问该人在购买保单后一年内将出事故的概率有多大？ 

解： 以这个投保客户是不是易出事故的人作为条件，我们将得到所求概率.记 
Ai 表示“投保客户一年内将出事故”这一事件,而以 A 表示“投保人为容易出事 
故者”这一亊件，则所求概率为 

P(>li) = P(Ai\A)P(A) + P(X!|>4 c )P(> 1 c ) = 0.4 x 0.3 +0.2 x 0.7 = 0.26 ■ 


例 3 a (第 2 部分）假设一个新的投保人在购买保单后一年内出了事故，问他 
是容易发生事故者的概率是多大？ 


解：所求概率为 P ( A |^), 可从下式计算 得到: 


P(A\Ai) 


P(AAi) 


P { A ) P ( A a \ A ) 0.3 x 0.4 

~ PiM ) = 0.26 


6/13 


例 3 b 考虑一副 52 张扑克牌的如下 玩法： 将洗好的一副牌都扣住，一次翻开 
一张.玩家只有一次机会可以猜接下来翻开的一张是否是黑桃 “ A ” ，如果是，那么 
玩家 获胜； 如果不是，那么玩家输.另外，如果一直到剩下一张还没有翻开，而此前 
没有出现过黑桃 “ A ” ，且玩家也没有猜过，那么玩家也获胜.较好的策略？较差的 
策略？ 

解： 其答 案是： 任何一种策略，获胜的概率都是 1/52. 为了说明这点，我们将 
用归纳的方法证明这个 结论： 对于 n 张牌，其中有一张牌为黑桃 “ A ” ，那么不管 
采取何种策略，获胜的概率都是 1/ r *. 这点显然对 n = 1是正确的.假设对 n - 1 
张牌，该结论也成立.现在考虑 n 张牌，对于任一给定策略，令 p 表示按该策略第 
一次就猜牌的概率.如果第 - 次就猜牌，那么获胜的概率为 1/n. 另一方面,如果按 
策略第一次不猜牌，那么获胜的概率就是第一张牌不是黑桃 “ A ” 的概率 ( n - l )/ n , 
乘以在第一张牌不是黑桃 “ A ” 的条件下，获胜的条件概率.而此条件概率就等于含 
—张黑桃 “ A ” 的 n - 1张牌的玩牌游戏中获胜的概率，利用归纳假设，该条件概率 
为 l /( n - l ), 因此,按策略第一次不猜牌的条件下,获胜的概率为 = \. 
因此，令 G 表示“第一次就猜牌”这一事件，我们可得 

P { 获胜 } = P { 获胜 | G } P ( G ) + 获胜 PKl - P ( G )) = ip +^( l - p ) = ^ ■ 

例 3 c 在回答一道多项选择题时，学生可能知道正确答案，否则就猜一个.令 
V 表示他知道正确答案的概率，则1 _ p 表示猜的概率.假定学生猜中正确答案的 
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概率为 1/ m , 此处 m 就是多项选择題的可选择答案数.求在已知他回答正确的条 
件下，该学生知道正确答案的概率？ 

解：令 C 和 K 分别表示事件“该学生回答正确”和“该学生知道正确答案”. 


这样 


P ( K \ C ) = 


P ( KC ) 

"P(CT = 


P ( C \ K ) P ( K ) 

: P ( C \ K ) P ( K ) + P ( C \ K c ) P { K c ) 

mp 


P + ( l / m)(l - p ) 1 + (m - l)p 

比如 ， m = 5 ，p = 1/2,那么在已知该学生回答正确的条件下，他知道正确答案 
的条件概率为 5/6. ■ 

例 3 d —项血液化验有95%的把握将患有某种疾病的患者诊断出来，但是， 
这项化验用于健康人也会有1%的“伪阳性”结果（也即，如果一个健康人接受这 
项化验，则化验结果误诊此人患该疾病的概率为 0.01). 如果该疾病的患者事实上 
仅占人口的0.5%,若某人化验结果为阳性，问此人确实患该疾病的概率为多大？ 

解： 以 D 表示“接受化验的这个人患该疾病”这一事件， B 表示“其化验结果 


为阳性”这一事件,所求概率 P ( D | E ) 为 


P { D \ E ) 


P ( DE ) 

~PiE)~ 


P ( E \ D ) P ( D ) 

P ( E \ D ) P ( D ) + P { E \ D ^) P ( D ^) 


=_°- 95 x M 95_ = o .323 

0.95 x 0.005 + 0.01 x 0.995 294 

因此,在验血结果为阳性的人当中，真正患该病只有32%.对于这一结果，许多学生 
感到非常吃惊（因为验血似乎是个好办法，他们总认为这个数值应该高得多)，因此， 
有必要给出第二个解法.与前一个解法比较，第二个解法尽管不严格，但却更直观. 

由于事实上患该疾病的人占的人口比例为0.5%,平均地算，接受化验的每200 
个人中应有1个患者,而这项化验只能保证疾病的患者被诊断为患病的概率为 0.95, 
因此,平均地说，每200个接受化验者能保证有 0.95 个人被诊断出，并且此人真的 
患病.但另一方面（平均地说)，在其余199个健康人中，这项化验会错误地诊断出 
199 x 0.01 个人患该病，因此,每当诊断出 0.95 个病人时（平均地说）总有 199 x 0.01 
个健康人误诊为患病.于是，当验血结果确定某人患该病时，正确诊断所占比例为 


0.95 + 199 x 0.01 _ 294 

公式 （3.1) 就是著名的全概公式.利用它还可以导出著名的贝叶斯公式（或逆 
概公式)，根据附加信息，可对某事件的概率进行 修正. 下面的例子就是贝叶斯公式 
的应用. 

例 3 e 假设某药剂师考虑如下诊断 方案： 如果我有80%的可能确定病人确实 
有此病，那么我会建议 手术; 而如果我并不确定，那么我会推荐做进一步的检査，该 
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检査是昂贵的，有时也是痛苦的.现在，开始我仅仅有60%的把握认为琼斯患有此 
病，因此我推荐做了 A 项检査，该检査对于确有此病的患者给出阳性结果，而对健 
康人却不会给出阳性结果.经检査琼斯的结果是阳性后，正当我建议手术时，琼斯 
给了我另一个信息,他患有糖尿病.这个信息带来麻烦.尽管它并不影响我一开始 
认为他患有此病的60%的把握，但是却影响了检査项目 A 的效果.因为虽然该检 
査项目对健康人不给出阳性，但是对于患有糖尿病却不患有这种疾病的人来说，有 
30%的可能给出阳性结果.那么我现在该如何做？是做进一步检査,还是立即手术？ 
解： 为了决定是否建议手术，医生首先要计算在检査项目 A 为阳性结果的情 
况下，琼斯患该病的概率.令 D 表示“琼斯患此病”这一事件， E 表示“项目 A 为 
阳性结果”这一事件,那么所求条件概率 P(D|E) 为： 

prn|F v_ P ( DE ) = P ( E \ D ) P { D ) = 0.6x1 ^ 

1 1 ; _ P ( E ) ~ P { E \ D ) P ( D ) + P(S|D C )P(D C ) - 1 x 0.6 + 0.3 x 0.4 
注意到我们以琼斯是否患有此病为条件计算了项目 A 为阳性结果的概率，并且利 
用了如下 事实： 因为琼斯患有糖尿病，已知其不患上述疾病的条件下项目 A 为阳 
性结果的条件概率 P ( E \ D C ) 等于0.3,因此，医生现在能80%的把握确定琼斯患有 
此病，所以应该建议手术. ■ 

例 3f 在某刑事调査过程中，调査员有60%的把握认为嫌疑人确犯有此罪•假 
定现在得到了一份新的证据，表明罪犯有某个身体特征（左撇子，光头或者棕色头 
发等)，如果有20%的人有这种特征,那么在嫌疑犯具有这种特征的条件下，检査官 
认为他确犯此罪的把握为多大？ 

解： 令 G 表示“嫌疑犯的确犯此罪”这一事件，而 C 表示“他具有罪犯的该身 
体特征”，那么我们有 

p(Glc) . P ^ GC )- P ( C \ G ) P ( G ) __ _ 1 x 0,6 _ w08g2 

- p [ C ) ~ P ( C \ G ) P { G ) + P(C|G c )P(G c ) 1 x 0.6 + 0.2 x 0.4 

其中我们假定了嫌疑犯事实上没犯罪却有该身体特征的概率为0. 2 ,也就是具有这 
个特征的人口的比例. ■ 

例 3g 1965年5月，在布宜诺斯艾利斯举行的世界桥牌锦标赛上,英国一对 
著名的桥牌手 T. 里斯和 B. 夏皮罗被指控作弊，说是他们用手指作暗号暗示他们 
红心的张数.里斯和夏皮罗都否认这项指控.事后，英国桥牌协会举行了一个听证 
会.听证会以法律的程序进行，既包含控方，也包含 辩方. 双方都有目击证人.在接 
下来的调査过程中，控方检査了里斯和夏皮罗打的几手牌，并声称他们的打法与用 
作弊已知了红心的张数的打法是吻 合的. 针对这个观点，辩方律师指出，他们的打 
法同样也同标准打法一致.然而，控方指出，既然他们的打法与其作弊的假设是一 
致的，那么就应该是支持这种假设.你如何理解控方的理由？ 

解： 此问题基本上是新的证据（在此例中，牌的打法）是如何影响某个特定假 
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设成立的概率的问题.现在，令 if 表示“某个特定假设（里斯和夏皮罗确实作弊)” 
而表示“新的证据”，那么 


P (綱= 


P ( HE ) 

P ( E ) = P ( E \ H ) P ( H ) + P ( E \ H C )[1 - P (丑 )j 


P ( E \ H ) P ( H ) 


(3.2) 


其中 P ( H ) 为在新证据展示之前我们对假设成立的可能性的估值.新证据支持假设 
成立，如果它使得假设成立的可能性增大，也即 P (, H \ E ) > P ( H ). 利用公式（3.2)， 
此式等价于 P { E \ H ) ^ P ( E \ H ) P ( H ) + P ( E \ H C )[1 - P ( H )], 或者等价于 P ( E \ H ) ^ 
P { E \ H % 也就是说，任何新的证据被认为是支持假设成立的，除非当假设成立时， 
该证据发生的概率大于假设不成立时发生的概率.事实上，已知新的证据发生的条 
件下,假设成立的新概率和初始概率的关系可从下式 看出： 

P ( H ) _ 


P { H \ E ) = 


P ( H ) + (1- P ( H )} 


P ( E \ H C ) 


J P ( E \ H ) 

因此，在所考虑的问题中，牌手的打法可以认为是支持假设成立的，除非在他们作 
弊的条件下这种打法的可能性大于他们不作弊的条件下这种打法的可能性.而 


控方并没有作此 声明. 因此，他们关于新证据是支持作弊的假设的这一断言是无 
效的. ■ 

在一咖啡店喝冰茶时，我要了一杯水和同样杯子的一杯茶.喝茶时，我不断地 


向茶杯里续水.假设水和茶充分混合，那么关于我的最后一口是茶的概率问题引出 


了以下问題中的 （a), 并且给出了有趣的答案. 

例 3h 坛子1里面最初有 n 个红色分子，坛子2里面有 n 个蓝色分子，按照 
以下方式进行 操作： 从坛子1里随机移走一个分子，然后，从坛子2里取一个分子 
(如果里面还有分子的话）放进坛子1里.一直进行这样的搡作,直到坛子1和坛子 
2中所有的分子都被移走（一共从坛子1移了 2ri 次，但是从坛子2 —共移走了 71 


个蓝分子 

(a) 求 P { R ), 其中表示亊件“从坛子1最后一个移走的分子是红色的” • 

(b) 如果坛子1里最初有 n 个红分子， h 个蓝分子，而坛子2里有 r 2 个红分 
子，62个蓝分子，重求上述概率. 

解： （a) 将注意力放在某个特殊的红分子上，令 F 表示“该特殊的红分子是最 
后一个被移走的”.若 F 发生,那么在坛子1中移走了 n 个分子以后（相芒坛子 2 
中的 n 个蓝色分子也已经被移走了)，这个分子仍然在坛子1中 •令 风表示“该分 
子不是第 i 次被移走的分子”，显然有 

P(F) = P(Ni … N n F) = P{Ni)P{N2\N!) ■■- P{N n \Nj - - - N n -i)P{F\N! … iV„) 

=(卜9… G - W 

其中 P(F\N U ■■- ,N n ) 表示坛子1中共有 n 个分子（包括那个特殊的红色分子), 
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一个一个取出时，那个特殊分子在最后取出，显然它等于 1/ n . 

因此，如果我们给 n 个红分子标号，令表示红分子:/最后被移走，那么通 
过上面的分析可得 ， 

^)=(1-1)1 
因为事件馬互不相容,我们可得 

w )= p ( f >) = E p ( 尽 ) = ( 1 -^) n « e " 1 

( b ) 现在假设坛子 i 里最初有 n 个红分子和 h 个蓝分子 （i = 1,2). 为了计算 
最后移走的分子是红分子的概率 P ( R ), 将注意力集中在坛子1里最初的某个特殊 
的分子（这个特殊的分子可以是红的，也可以是蓝的).类似 （ a ) 可得该分子在最后 
被移走的概率为 

1 \»^+^ 1 

P= l 1 -^T67J ^+6 ： 

上式中，因子 (1 - 表示当第二个坛子被取空以后，那个特殊的分子 

仍然在第一个坛子内 1 的概 1 率，而 l / Cn + fei ) 为在前面那个事件发生的条件下，继续 
从坛子1内一个一个地取分子，而那个特殊的分子被最后取出的概率.现在记0为 
“最后移走的分子是在坛子1中的分子”，则 

为计算 P ( R ), 我们以0是否发生为条件，得到 
P ( R ) = P ( fl |0) F (0) + F ( fl | O c ) F ( O c ) 

=一 - i —) ra+b2 + [i - (i - - vr+i 

n + bl v J - ! + 6 l / T 2 + &2 !• v f"l + Oi / J 

如果 n = r 2 + bj = n ， 这样两个坛子里最初都有 n 个分子，当 n 充分大时， 
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卜点 (1 _ e-1) 


当发现新的证据时,假设成立的概率之变化可以表示为假设的“优势”之变化， 
其中优势的概念定义如下 • 


定义事件4的优势定义为 


P { A ) . 
攀） " 


P ( A ) 


l - P ( A ) 

即事件4的优势告诉我们该事件发生的可能性是不发生的可能性的倍数 ■ 
举例来说，如果 P ⑷= 2/3,那么 P { A ) = 2 P ( A C ), 因此，事件 A 的优势等 
于 2. 如果某事件的优势等于 a , 那么通常称支持假设成立的优势为 “ a 比 
1”也是同样的意思.__ 
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现在考虑假设//以概率 P ( H ) 成立，如果我们发现了新的证据 E, 那么£成 
立的条件下，成立和 i/ 不成立的条件概率分别为 

P ( E \ H ) P ( H ) P ( E \ H C ) P ( H C ) 

- ~ P{E) ^ { ' )_ ^ W 

因此，引进证据£后，假设丑的优势为 


P(H\E ) = 


P ( H \ E ) 

P ( H ) P ( E \ H ) 

P ( H C \ E ) 

P ( H C ) P { E \ H C ) 


即//的新的优势值等于它原来的优势值乘以新的证据在 H 和只《=之下的条件概 
率比值.这个结论也验证了例 3f 的结论.如果， H 的条件下新的证据的条件概率大 
于//<=的条件下的条件概率时， H 的优势值是递增的.反之，为递减的.此处我们 
将随机事件 H 称为“假设”，这是借用了犯罪学中的术语.我们称犯罪嫌疑人“有 
罪”为假设,而不称事件. 

例 3i 坛子中有硬币 A 和硬币 B 各一枚.当抛掷硬币 A 时,其正面朝上的概 
率为1/4,而抛掷硬币 B 时，正面朝上的概率为 3/4. 假设从坛子中随机挑选一枚 
硬币进行抛掷.如果己知抛掷的结果是正面朝上，那么选中的是硬币 A 的概率是多 

大？ 

解：记 >1为亊件“抛掷的硬币为 A” ， S = #表示“抛掷的硬币为 B” . 我们 
需要计算正面向 上). 利用公式 (3.3) 得到 

正面向上） P{A) (正面向上丨 /!) 

正面向上） = P(B) P (正面向上 | S) 

H 都 

即在正面向上的条件下，硬币4的优势为2/3:1,或，抛掷硬币>1的（条件）概率为 
2/5. ■ 

公式 (3.1) 可以推广 如下： 假设 F x ,F 2 ,--,F n 为互不相容事件，满足 U? =1 Fi = 
S, 也就是说， F,,F 2 , -,F n 中必有且仅有一个亊件 发生. 将£:写成£ = Ur=i 五只. 
然后利用 亊实： EFi,i=l, ■■- ，n 为互不相容事件，我们可得 

P(E) = Y, p ( EF i) = P(E\Fi)P(Fi) (3.4) 

i=l i=l 

公式 (3.4) 表明，对于给定的一组完备的事件 F u F 2 , - ,F n , 即巧 ，…， 为 
互不相容的事件，并且11巧= S(S 为必然事件).我们可以通过 P{E\Fi) 来计算 
P(E). 即公式 （3.4) 叙述了 P(E) 等于 P(E\Fi) 的加权平均，每项的权为事件尺发 
生的概率. 

例 3j 在第2章例 5 j 中，讨论了一事件的概率计算问题.设将一副扑克牌一 
张一张地往外翻，在翻出第一张 A 之后接着再翻出某一种牌的概率的 计算. 我们利 
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用组合方法指出这个概率等于 1/52. 现在利用条件概率的方法进行计算. 令 E 为 
事件“翻出第一张 A 后又接着翻出某一牌（例如: E)” .将 牌: c 去掉，记0为剩下 
的51张牌的随机次序，我们有 

P ( E ) = 乙尸(五 |0) 尸 (O) 
o 

对于给定的0,对应于52个整副牌的次序,它们相应于把 a; 插入由0所形成的52 
个位置.显然这52个位置是完全等概率的，而 事件五 只相应于: r 插在第一张 A 后 
面的位置，这样 P { E \0) = 1/52. 这说明 P ( E ) = 1/52. ■ 

现在假定， F,, - F n 是一组互不相容的事件，并且它们的和亊件为必然事件 
(称为完备亊件组). 


现在假设 JS 发生了（新的证据)，我们想要计算均发生的概率，利用公式（3.4)， 
我们有如下命题. 



公式 （3.5) 称为贝叶斯公式，最早由英国哲学家托马斯.贝叶斯 提出. 如果我 
们把事件6设想为关于某件亊件的各个可能的“假设条件”，那么，贝叶斯公式可 
以这样 理解： 它告诉我们，在试验之前对这些假设条件所作的判断 [即 P(^)], 可以 
根据试验的结果来进行修正. 

例 3k —架飞机失踪了，推测它等可能地坠落在3个区域.令1 - A 表示飞 
机坠落在第 i 个区域时被发现的概率 （ft 称为疏忽概率，它决定于该区域的地理和 
环境条件).已知对区域1的搜索没有发现飞机，求在此条件下，飞机坠落在第 i 个 
区域 (i = 1,2,3) 的条件概率. 

解：令 负, i = 1,2,3表示“飞机坠落在第 i 个区域”这一事件，令五表示“对 
第1个区域的搜索没有发现飞机”这一事件，利用贝叶斯公式可得 


P(Ri\E) 


P(ERi) 

-~ p ( Er ' 


P(g|fl!)P(fll) 

"1 

^PiEmPiRi) 




• /3i+2 


对于 _?• = 2,3, 有 


P(Rj\E) 


P(E\R j )P(R j ) _ 
' P ( E ) ' 
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值得指出的是，当搜索了第1个区域没有发现飞机时，飞机坠落在第# 1) 
的概率会增大，而坠落在第1个区域的概率会减小.这是一个常识 问题： 因为既 
然在第1个区域没有发现飞机，当然飞机坠落在该区域的概率会减少，而坠落在 
其他区域的概率会增大.而且飞机坠落在第1个区域的条件概率是疏忽概率汍 
的递增函数.当 A 增加时，增大了飞机坠落在第1个区域的条件概率.类似地, 
P(Rj\E),j / 1是负的递减函数. ■ 

下一个例子经常被学过概率而又不讲道德的学生们用来从他们概率知识较少 
的朋友那里贏钱. 

例31假设有3张形状完全相同但所涂颜色不同的卡片，第一张两面全是红 
色， 第二张两面全是黑色，而第三张是一面红一面黑.将这3张卡片放在帽子里混 
合后，随机地取出1张放在地上，如果取出的卡片朝上的一面是红色的，那么另一 
面为黑色的概率是多大？ 

解：令 RR ， BB , RB 分别表示取出的卡片是“两面红”、“两面黑”以及“一面 
红一面黑”这三个事件.再令 ft 表示取出的卡片“朝上一面是红色”这一事件.我 
们可如下得到所求 概率： 

p ( RBnR ) 

P ( RB \ R )- p{R) 

P ( R \ RB ) P { RB ) 

= P ( R \ RR ) P ( RR ) + P ( R \ RB ) P ( RB ) + P { R \ BB ) P ( BB ) 



因此，反面是黑色的概率为 1/3. 但是有些学生猜另一面是黑色的概率为1/2.他 
们的错误在于认为这张牌有两种可能，两面全红，或者一面红一面黑，这两种可能 
性是一样的.事实上，你可以把三张牌的6个面记为其 
中 ( Rx , R 2 ) 表示全红的那张牌的两个面, (B,,B 2 ) 表示两面均为黑色的那张牌的两 
个面， ( R 3 , B 3 ) 表示一红一黑的那张牌的两个面.即6个面是以相等的概率出现的. 
只有丑 3 出现时，背面是黑色的.而 Ri , R 2 出现时，背面均为红色的.因此，当正面 
为红色时，背面为黑色的概率为1/3而不是 1/2. ■ 

例 3m 镇上新搬来一对夫妇，已知他们有两个孩子.假设某天遇到该母亲带 
着一个女儿在散步，问她的两个孩子都是女儿的概率是多大？ 

解： 首先，定义如下事件. 

Gi ： 第一个（也即最大的）孩子为 女孩； 

G 2 ： 第二个孩子为女孩； 

G ： 被看到跟母亲一起散步的为女孩. 
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而且令历 ，执, S 表示类似上述的事件，其中“女孩”替换为“男孩”.这样，所 
求概率 P( GiG 2 |G) 可以表示 如下： 


P( GiG 2 |G) 


P(GiG 2 G) 

P ( G ) 


P^iG^ 

P ( G ) 


而且， 


P ( G ) = P ( G \ G l G 2 ) P ( GiG i ) + P ( G \ GiB 2 ) P ( GiB 2 ) 

+ P(G|B 1 G 2 )P(B 1 G 2 ) + P { q \ B l B 2 ) P ( B l B 7 ) 

= P ( GiG 2 ) + P ( G \ GiB 2 ) P ( GiB 2 ) + P ( G \ BiG 2 ) P { B l G 2 ) 

其中最后一个等式用到了结论= 1以及 P { G\BM = 0. 如果我们通 
常地假设4种可能结果 G 1 , G i , B l , B 2 都是等可能的，那么我们有 
-< ,々、 1/4 1 

P ( GiG 2 | G ) = 1/4 + p ( G | Gifl 2 )/4 + P ( G \ B x G 2 ) I ^ = 1 + P ( G | GiB 2 ) + P ( G | BiG 2 ) 

因此，答案依赖于已知事件 0^2 条件下，碰到母亲带着女孩的条件概率，以及已 
知事件 g 2 b 1 条件下，碰到和母亲带着男孩的条件 概率. 举例来说，我们假定母亲 
对于性别没有倾向，母亲带着大孩子 -- 起散步的概率为 P ， 那么有 
P { G \ GiB 2 ) = P = 1 - P { G \ BiG 2 ) 

即 P { G \ G X B 2 ) + i ^ GI ^ Ga ) = 1，从而 P ( GiGa | G ) = 1/2. 另一面，如果假定两个 
孩子性别不同，母亲带着女孩一起散步的概率为且与孩子出生的次序是独立的， 
那么我们有 P ( G\GM = P ( G \ BiG 2 ) = 9 ,意味着 P ( GiG 2 \ G ) = 1/(1 + 2 q ). 举例 
来说,如果我们取<? = 1，即母亲总是选择女孩一起去散步，那么两个都是女孩的条 
件概率为 1/3. 这点同例 2 b 是一致的，因为事件“看见母亲带着一个女孩”与事 
件“至少有一个女孩”是等价的. 

因此，综上所述，此问题是无法解的.事实上，即使假设孩子的性别是等可能 
的，我们仍需要额外的假设才能解决问题.因为该试验的样本空间包含了如 I 形式 
的 向量： （化〜 i ), 其中^表示大孩子的性别，表示小孩子的性别， i 表示被碰 
到的孩子的出生次序.因此，为确定样本空间的点的概率，光知道孩子的性别的概 
率是不够的，还需要知道母亲所带孩子的出生次序的条件概率（给定大小孩子的性 
别). B 

例 3 ii 储物箱里有3种不同的一次性手电.第一种手电使用超过100小时的 
概率为 0.7, 而第二种和第三种手电相应的概率分别只有0. 4 和 0.3. 假设箱子里的 
手电, 20%的为第一种，第二种和第三种分别为30%和50%. 

( a ) 随机挑一个手电，能使用100小时以上的概率是多大？ 

( b ) 己知手电使用超过100小时，问它是第 j 种手电的条件概率是多大 （j = 
1,2,3)? 
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解： （ a ) 令 A 表示“挑出的手电能使用100小时”这一事件，令&表示挑出了 
第 j 种手电 （j = 1,2,3). 为了计算 P ( A ), 以挑出手电的种类为条件,可得 
P { A )= PiA ^ P ^ F !) + P ( A \ F 2 ) P ( F 2 ) + P ( A \ F 3 ) P ( F 3 ) 

= 0.7 x 0.2 + 0.4 x 0.3 + 0.3 x 0.5 = 0.41 


因此，随机挑选的手电能使用使用100小时以上的概率为 0.41. 
( b ) 利用贝叶斯公式得到所求 概率： 

因此， 


P ( 职剛 ） 
0.41 


■ PW ) = 0.7 x 0.2/0.41 = 14/41 
P ( F 2 \ A ) = 0.4 x 0.3/0.41 = 12/41 
P ( F 3 \ A ) = 0.3 x 0.5/0.41 = 15/41 


举例来说，对第一种手电，尽管被选中的初始概率只有 0 . 2 , 但是得到手电使用超过 
100小时的信息后，这个概率提升到14/41 » 0.341. ■ 

例 3 o 警方从案发现场罪犯的身体遗留物中提取了 DNA , 法医研究后注意到 
能够辨认的只有5对染色体，而且每个无罪的人，与这5对染色体相匹配的概率为 
10- 5 ,律师认为罪犯就是该城镇100万居民之一.在过去10年内，该城镇有10 000 
人曾蹲过监狱.他们的 DNA 资料都记录在案.在检査这些 DNA 文档之前,律师认 
为这10 000有犯罪前科的人犯此罪的概率为 a . 而其余990 000居民，每人犯此罪 
的概率为汰其中 a = c 別也即，他认为最近10年内释放的有犯罪前科的人作案的 
可能性是其他人的 c 倍).将 DNA 分析结果同这10 000个有犯罪前科的人的数据 
文档对比后，发现只有 AJ 琼斯的 DNA 符合.假设律师关于 a 和0之间的关系是 
准确的， AJ 作案的可能性有多大？ 

解： 首先注意到概率之和必等于1，因此我们有 


1 = 10 000 a + 990 000/3 = (10 000 c + 990 000)0 


即 

_ 1 _ c 

10 000 c + 990 000 a = 10 000 c + 990 000 


现在，令 G 表示“ AJ 为作案者”，令 M 表示 “ AJ 是这10 000人中唯一的与现场 
DNA 相匹配的人”.那么 


P ( G \ M ) = 


P ( GM ) 

P ( M ) = 


P ( G ) P ( M \ G ) 

P { M \ G ) P { G ) + P ( M \ G e ) P ( G c ) 


如果 AJ 为作案者，此时其他的9999人都不是作案者•这10 000人中 AJ 是唯一 


匹配者的概率为 P ( M | G ) = (1 - 10- 5 ) 9999 . 
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令 C = { 除 AJ 外,其他有前科的人不是作案者>，则 

pm - P(CGC ) i_ 10000a 

P(C|G ^_ P ( G <=) - 1 - a 

同样，在除 AJ 外，其他有前科的人不是作案者的前提下，这9999人与现场 
DNA 相匹配的概率为 （1 一 10- 5 ) 9999 , 所以① 

P { M \ CT ) = 10~ 5 (1 - 10- 5 ) 9999 C ' 1 :: 00 。 ) 

现在我们已经计算得到 P ( M | G ) 和 P ( M | G e ) 的公式，结合 P { G ) = a , 将这些 
公式代入到 P ( G \ M ) 的表达式中，得到 

P ( G \ M ) = a + 10 -5( i _ 10 ( X )0 a ) = 03 丨 10~ 5 
a 

因此，如果律师最初认为任一有犯罪前科的人作案的可能性是没有犯罪前科的人的 
100倍（也即 c = 100), 那么 a = 1/19 900,且 P ( G \ M ) = 1/1.099 « 0.9099. 如果律 
师最初认为 c = 10,那么 a = 1/109 000,且 P { G \ M ) = 1/1.99 w 0.5025. 如果律师 
最初认为任一有犯罪前科的人作案的可能性与镇里其他人是相同的 （c = 1), 那么 
a = 1 CT 6 , 且 P ( G | M ) = 1/10.9 « 0.0917. 因此,概率变化范围是从大概9%(此时律 
师最初假设所有人作案的概率一样）到91%(此时他认为每个有犯罪前科的人作案 
的概率为其他任一居民的100倍). ■ 


3.4 独立事件 

本章前面的例子显示 ：己知 F 的条件下 S 发生的条件概率 P{E\F) 一般来说 
不等于£发生的（无条件）概率 P{E). 也就是说，知道了 F 已发生通常会改变五 
的发生机会.但在一些特殊情形下， P(E\F) 确实等于 P(E), 此时我们称 E 和 f 

①文中的公式可以这样 理解： 对于概率 P(M|G«) 利用全概公式可得 

P(.M\Cr) = P(C\G c )P(M\CG c ) + P(C c \G c )P(M\C c G c ) 

上述右边第.一項中因子 PCMIC^G 1 ) 是不 si 能亊件的概率，这是因为 C C G° 表示作案者在除 AJ 
外的9 999个有前科的人中间，而 M 表示这10 000个人中 AJ 是唯一匹配者，故 = 
0. 这样全概公式转化为 

P(M\G°) = P^^P^CCT). 


而 CG° 表示这10 000个有前科者均不是作案者，这样 AJ 为唯一匹配者的概率为 P ( M \ CG ^) = 
10-6(1 - 10-*) 9999 . 而正文中前面己求得 P(C|G C ) 的值.将这两个因子相乘就可得到文中的 
公式，即 PfAflG*) 的值.——译者注 
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独立.即如果已知 F 的发生并不 影响五 发生的可能性，那么五和 F 就是独 立的. 


因为 P ( E \ F )= P ( EF )/ P ( F ), 所以如果下式成立，那么£和 F 独立： 

P ( EF ) = P { E ) P ( F ) (4.1) 

由于公式 (4.1) 关于 E 和 F 是对称的，就说明了只要 E 和 F 独立，那么 F 和五 
也独立，因此,我们有以下定义. 


定义对于两个事件 E 和尸，若 （4.1) 式成立，则称它们是独立的 ( indepen ¬ 
dent . 若两个事件£和 F 不独立，则称它们是相依的 ( d 印 endent ), 或相互 

不独立. _ 

例 4a 从一副洗好的 52 张扑克牌里随机抽取一张牌.记五表示事件“抽取 
的牌为一张 ‘A’ ” ， 记 F 表示事件“抽取的牌为一张黑桃”，那么五和 F 就是独 
立的. 因为 P { EF ) = 1/52, 而 P ( E ) = 4/52 且 P(F) = 13/52. ■ 

例 4 b 掷两枚硬币，假设全部 4 个结果出现的可能性是一样的•记瓦表示事 
件“第一枚硬币正面朝上”，记 F 表示“第二枚硬币反面朝上”，那么 E 和 F 是 
独立的，因为 P { EF ) = P{(H,T)} = 1/4, M P ( E ) = P({(H,H),(H,T)}) = 1/2, E . 
P(F) = P({(H,T),(T,T)}) = l/2. ■ 

例 4 c 掷两枚均匀的骰子，记 G 表示亊件“骰子点数之和为6”， F 表示事 
件“第一枚骰子点数为 4” ， 那么 P { E X F ) = P({(4,2)}) = 1/36. M P(E,)P(F) = 
5/36 x 1/6 = 5/216, 因此，五：和 F 不独立.直观来说，这个原因是显而易见的，因 
为如果我们关注掷出点数和为 6( 两枚骰子)，那么在第一枚骰子为 4 (或者1,2,3,4,5 
中任一个)，我们都还乐观，因为此时仍有机会得到和为 6. 另一方面，如果 第-枚 
骰子为6,那么我们就不乐观了，因为没有任何机会得到点数和为6 了.也就是说, 
得到和为6的机率依赖于第一枚敗子的结果，因此，说和 F 不可能独立 • 

现在，令及表示事件“骰子数之和为7”，那么氏是否和 f 独立？答案是肯 
定的，因为 P ( E 2 F ) = P ({(4,3)}) = 1/36,而 P ( E 2) P ( F ) = ^ x - = 1/36. 

我们留给读者去证明此直观的 结论： 为什么事件“骰子点数之和为7” 同第一 


枚敢子的点数是独立的. ■ 

例 4 d 令£：表示事件“下届总统是共和党人”， F 表示事件“未来一年将会 
有一次大地震”，大多数人会认为五和 F 是独立的.然而，如果另外一个事件 G 
是“选举后两年之内会经历经济衰退”，那么对于只和 G 是否独立，却存在着长期 
争论. B 


接下来证明如果£独立于 F ， 那么£也独立于 


命题 4.1 如果 E 和 F 独立,那么£和严也独立 • 


证明： 假定 E 和 F 独立. 由于£ = U EF °, 且和 EF ^ 显而易见 
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是互不相容的，因此有 P { E ) = P { EF ) + PiEF ^) = P ( E ) P ( F ) + P { EF C ) 这样, 
P (£ F °) = P(£)[l - P ( F )] = P ( E ) P ( F C ) 命题得以证明. 口 

因此，如果和 F 是独立的，那么无论得知 F 发生的信息，还是得知 F 不发 
生的信息，£发生的概率都是不变的. 

现在假设 五既和 F 独立，也和 G 独立，那么 E 是否一定和独立？答案 
有点不可思议，是否定的.考虑如下 例子： 

例 4 e 掷两枚均匀的骰子.记表示事件“骰子点数之和为7” ， 记 F 表示 
事件“第一枚骰子点数为4” 以及 G 表示事件“第二枚般子点数为3” . 从例 4 c 可 
以得知， 五和 F 是独立的，同样的理由可以说明 E 和 G 也是独立的.但是，很明 
显£和 FG 是不独立的，因为 P ( E \ FG ) = 1. ■ 

从例 4 e 还可以得出关于三个事件艮 F 和 G 的独立性的合适的 定义. 三个事 
件的独立性比要求所有的对事件的独立更强，我们给出如下定义 • 


定义三个事件£:， F 和 G 称为独立的，如果 

P ( EFG ) = P ( E ) P ( F ) P ( G ) P ( EF ) = P ( E ) P ( F ) 

P ( EG ) = P ( E ) P ( G ) P ( FG ) = P(F)P(G) 

值得注意的是，如果 B , F 和 G 是独立的，那么£；与 F 和 G 的任意组合事件 
都是独立的.比如， E 和 FUG 就是独立的，因为 

P [ E { FUG )} = P(EFU EG ) = P ( EF ) + P ( EG ) - P ( EFG ) 

= P ( E ) P ( F ) + P { E ) P ( G ) - P ( E ) P ( FG ) 

= P { E )[ P ( F ) + P(G) - P ( FG )] 

= P ( E ) P{F U G ) 

当然，还可以推广到三个以上事件的独立性定义.事件玖，…，五 n 称为独立的， 
如果对这些事件的任意子集 E V ， E 2，， … , E r ， y ^ n , 都有 

P ( E V E 2'-- E r .) = P ( E V ) P ( E V )-- P ( E r >) 

最后，我们来定义无限个事件的独立性.如果无限个事件的任意有限个子集都是独 
立的，则称这无限个事件是相互独立的 • 

有时会遇到这种情况，所考虑的概率试验由一系列子试验组成.例如，连续抛 
掷一枚硬币这个试验，就可以把每掷一次看作一个子试验.在许多场合下，假定任 
一组子试验的结果不影响其他子试验的结果的假设是合理的.如果真是这样，我们 
称这些子试验是相互独立的.更确切的说，称一系列子试验是相互独立的，如果任 
意的事件序列 E 1 , E 2 ,---, E n , - 是相互独立的事件序列，这里，事件屄完全由第 
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i 次子试验的结果所决定. 

如果各个子试验彼此相同，即各子试验有相同的（子）样本空间及相同的事件 
概率函数，那么就称这些试验为重复试验. 

例 4 f 设在独立重复试验的无限序列中，每次试验结果成功的概率为 p , 失败 
的概率为 l _ p , 试求如下 概率： 

( a ) 前 n 次试验中至少成功1 次； 

㈦ 前 n 次试验中成功 次； 

( c ) 所有试验结果都成功. 

解： 为计算前 n 次试验中至少成功1次的概率，先求它的对立事件的概率.它 
的对立事件就是“前 n 次试验全失败了”. 若以艮 表示第 i 次试验失敗这一事件， 
则由独立性可得，前 n 次试验全失败的概率 

…五= P (£ i ) P ( E 2) ■•- P ( E n ) = ( l - p) n 
因此， （ a ) 的答案就是 1-(1- p )". 

为解 （ b ), 考虑任一个由 fc 个成功、 n - k 个失败组成的前 n 个结果的特定序 
列.由独立性知，每个这样的序列发生的概率为 p *( l - p ) n -*. 由于共有个这 
样的序列（由 fc 个成功与 n - fc 个失败组成的序列总数为 n !/[*:!( n - fc )!]), 故所 
求概率为 

P { 恰有 * 次成功 } = (^) p fc ( l - p) n_fc 


为解 （ c ), 我们由⑷注意到，前 n 次试验全成功的概率为 P (£ f ^ ■■■ E c n ) = p n . 
因此，运用概率的连续性属性 （2.6 节)，我们可得所求概率二坷)为 

p(n^)=P( n bm o nEf)= n lim P(f]£?) 

i=l i=l i=l 



如果 p < 1 
如果 p=l 


例 4 g 由 n 个元件组成的系统称为 
并联的,如果至少有一个元件工作正常，那 
么整个系统都工作正常（如图 3.2). 对于 
这样的系统，如果元件 i 工作正常的概率 
为 P< ，i = 1，…， n ， 并且各元件的工作状态 
相互独立.那么整个系统工作正常的概率 
是多大？ 



图 3.2 并联 系统： 只要有一个开关是 
通的，>1与 B 之间就是通的 
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解 ：令戌 表示事件“元件 i 工作正常”，那么 
_ P { 系统工作正常 } = 1 - P { 系统工作不正常} 

=1 — 所有元件工作不正常 } 

= i-p(f|A 9 ) = i - f [( 1 - P <) 利用独立性 ■ 

i i=l 

例 4 h 进行独立重复试验，每次试验为掷两枚均匀的骰子，并记录两枚骰子点 
数之和.问“和为5” 出现在“和为7” 之前的概率是多少？ 

解：令 £„表示事件“前 n - 1次试验中，5和7都不出现，而第 n 次试验出现 
5”，那么所求概率为 

因为任一次试验中， P (和为 5) = 4/36,且 F ( 和为 7) = 6/36,这样，利用试验的独立 
性可以得到 

因此， 

该结果还可以利用条件概率得到.令石表示亊件“和为5出现在和为7之 
前”，那么以首次试验结果为条件也可得到所求概率，方法如 下：令 f 表示事件“第 
一次试验中两枚骰子的点数之和为5”， G 表示亊件“第一次试验中点数之和为7”， 
H 表示事件“第一次试验中点数之和既不是5也不是7” . 利用全概公式，有 


P ( E ) = P ( E \ F ) P ( F ) + P ( E \ G ) P ( G ) + P { E \ H ) P { H ) 


然而, P ( E \ F ) = 1, P { E \ G ) = 0, P { E \ H ) = P { E ). 前两个等式是显而易见的，第三个 
等式是 因为： 第一次结果既不是5,也不是7,那么这种状况又相当于重新开始了. 
也就是说，试验者将要连续扔两枚般子直到两枚敢子的点数之和为5或者 7 ,另一 
方面，每次试验都是独立的，因此，第一次试验的结果不会对接下来的试验有影响. 
因为 P ( F ) = 4/36, P ( G ) = 6/36, P ( H ) = 26/36,这样 P { E ) = J 或者 

P ( E ) = 2/5. 

读者可能会发现答案很直观，因为既然“和为5” 出现的概率为 4 /36而“和为 
7” 出现的概率为6/36,那么直观地看出5出现在7前面的比例为4 : 6,因此“和 
为5出现在和为7之前”的概率就为4/10,亊实上的确如此. 

这说明了如果五和 F 是一次试验中的两个互不相容事件,那么在独立重复试 
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验时，事件£；在事件 F 之前发生的概率为 
P ( E ) 

P ( E ) + P ( F ) 

例 4 i 有 n 种类型的优惠券，某人在收集优惠券的时候，每次收集到第 i 种 
优惠券的概率为 Pi ， E^iPi = l - 假定各次收集是相互独立的且同分布的.假设这 
个人收集了 fc 张优惠令次表示事件“其中至少有一张第 i 种优惠券”，对于 
i 一 j , 计算 

⑷ P ( Ai ) ( b ) PiAiUAj ) ( c ) PiA ^ Aj ) 

解： P ( Ai ) = 1 - P (^ J ) = 1 -尸{没有第 i 种优惠券} = 1-(1- Pi ) k , 上面利用 
了每种优惠券的收集都是独立的，并且收集到的优惠券不是第 i 种优惠券的概率为 
1- Pi . 类似地 

P(yl i U^) = l-P((A i U>l i ) c ) 

=1- 既没有第 i 种优惠券，也没有第:/种优惠券} 

= 1-(1-Pi-Pj) fc 

此处利用了每种优惠券的收集都是独立的，且收集到的优惠券既不是第 i 种优惠券 
也不是第 j 种优惠券的概率为1 - Pi - Pi . 

为了计算 我们利用等式 P ( AiUAj ) = PiA ^ + PiA ^- PiAiAi ). % 

中，利用 （ a ) 和 （ b ), 可以得到 

P ( AiAj ) = 1-(1 - P< ) fc + 1-(1 - Pi ) fc - [1-(1- Pi - Pj ) k ) 

=1 - (1 - pi) k - (1 - Pj) k + {1-Pi-Pj) k 


这样， 


P ^ Aj )= 


PjAjAj ) 


1 - (1 - Pi) k - (1 ~ Pj) k + (1 - Pi - Pj) k 


接下来的例子陈述了一个在概率论历史中占有显赫地位的问题，即著名的点數 
问題$ (problem of the points). 该问题是这 样的： 两个赌徒下了注后，就按照某种方 
式赌起来，规定得胜者贏得所有赌注.但在谁也没得胜之前，赌博因故中止了■此 
时每人都获得了一些“得分”，那么这些赌本该如何分呢？ 

这个问题是1654年 de M6r6 爵士向法国数学家帕斯卡提出的，爵士当时是一 
个职业赌徒.在攻克这一难题的过程中，帕斯卡提出了这样一个重要的思想 ：赌徒 
贏得的赌本的比例，取决于如果比赛继续进行下去，他们各自能取胜的概 率帕斯 
卡解决了一些特殊情形，更主要的是，他开始与法国著名的数学家费马建立了通信 
联系,讨论该问题.他们之间通信的结果，不仅完全解决了点数问题，而且还为解决 


①此处也可解释成醣本分割问题，更易为大家所理解.——译者注 
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很多其他机会游戏问题搭好了框架.有些人把他们建立通信联系的这一天看作概 
率论的生日.他们之间的著名的通信往来，对于激发欧洲数学家对概率论的兴趣也 
起了重要的作用.因为当时一流的数学家都认识帕斯卡和费马.比如，在他们建立 
联系后不久,荷兰的年轻数学家惠更斯也来到了巴黎，和他们一起探讨这些问题及 
其解法.而且，人们对这个新领域的兴趣和积极性也迅速高涨起来. 

例4 (点数问题）假设在独立重复试验中，每次成功的概率为 p , 失败的概率 
为1 - p . 问在 m 次失败之前已有 n 次成功的概率是多大？设想 A 和 B 进行这样 
的 赌博： 当试验成功时， A 得1分，试验失败时， B 得1分，如果 A 先得到 n 分那 
么 A 获胜,如果 B 先得到 m 分，那么 B 获胜.问 A 获胜的概率为多大？ 

解： 以下将给出两种解答.第一种是帕斯卡给出的，第二种是费马给出的. 

令 P n , m 表示事件 “ m 次失败之前己经出现了 n 次成功”的概率，以第一次的 
结果为条件,可得 

Pn,m ~ pPn—l,m + (1 — p)Pn,m—l 71 ^ 1, HI ^ 1 
(为什么？给出理由 .） 利用很明显的边界条件 P „, 0 = O . Po.m = 1,该等式能解出 
F „, m . 与其深入枯燥的细节，不如来看看费马的解答. 

费马论证了，要使得 n 次成功出现在 m 次失败之前，那么在前 m + n - 1次试 
验中，至少有 n 次成功.（即使在试验 m + n -1 次之前，赌博就结束了，我们仍可 
以假设剩下的试验继续进行 .） 事 实上，如果在前 m + n -1 次试验中至少有 n 次 
成功,那么至多有 m - 1次失败，因此 n 次成功必然出现在 m 次失败之前.另一方 
面，如果 m + n - 1次试验中不超过 n 次成功,那么至少有 m 次失败，因此, n 次成 
功不会出现在 m 次失败之前. 

因此，如例 4 f 中指出的 ， m + n -1 次试验中恰好成功 fc 次的概率为 
( m 4 T _1 ) pfc(1 - P ) m + n - 1 - fc , 我们可得所求的 n 次成功出现在 m 次失敗之前的概 
率为 

Pn, m = m fl\ Tn+ k~ V(1 _ P) m+n_1_fc ■ 

fc=n 

下面两个例子是关于赌博问题，其中例 4 k 的分析特别细致 .® 

例 4 k 假定一共有 r 个玩家,每个玩家 i 手中有叫个单位的赌资 ， m >0,1 = 
1,... , r . 在赌博的每一阶段，随机地选出两个玩家，让他们进行赌博，其中贏者从 
输者那儿拿到一个单位的赌资，当一个玩家输光了赌资以后，就退出赌博.这个过 
程一直维持到只剩下最后一个人，此时他拥有全部赌资 n = Er = i n <- 他就是—个 
胜利者.现在假定各个阶段之间是相互独立的，并且参加赌博的任何两个人的能力 
是相同的，即在每一阶段的两个参加赌博的玩家具有相同的概率打败 对方. 现求玩 


①本节的余下部分为选读. 
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家 i 成为胜利者的概率. 

解： 开始时，假定 n 个玩家每人只有一个单位的赌资.考虑玩家 i ， 他每次参加 
赌博，要么贏一个单位的赌资，要么失去一个单位的赌资.他会继续赌下去，直到他 
的赌资成为0或 n . 由于 n 个玩家的能力是完全相同的，因此，在这种情况下，玩 
家 i 成为最后胜利者的概率为 1/ n . 

现在假定 n 个玩家分成 r 个组，第 i 个组内含叫个玩家 ， t = 这样， 

第 i 组的玩家成为胜利者的概率为 ni / n . 如果把 i 组的玩家成为胜利者看成 i 组 
的胜利，在各阶段各组的赌资就是组内各玩家赌资的总和，将赌博看成团体间的赌 
博.这样，在初始状态各参赌团体的赌资为^,< = 1,•■- , r . 每一阶段的赌博，参赌 
的团体的赌资 增加一 个单位或减少一个单位，显然，第 i 个参赌团体胜利的概率就 
是只 = n ^/ n . 由分析可以看出，这个结果与各阶段的参赌团体的选择是无关的 .■ 

接下来的例子是著名的“赌徒破产问题”. 

例41 (赌徒破产问题）两个赌徒，就连续抛掷一枚硬币的结果进行打赌.对于 
每-次 抛掷，如果是正面朝上， B 将支付给 A —元,如果是反面朝上， A 将付给 B 
一元 .- •直这样下去，直到某-方钱输光.假定连续抛掷硬币是独立的，且每次的 
结果正面朝上的概率为 P , 假定开始时 A 有 i 元, B 有 AT - i 元，问 A 最后能贏得 
所有钱的概率是多大. 

解•令 E 表示事件“开始时 A 有 i 元, B 有 JV - i 元，而 A 最后 K 得所有钱” • 
很显然它和 A 最初的钱数是有关的，记= P { E ). 以第一次掷硬币的结果为条 
件，令 i / 表示事件“第一次为正面朝上”，这样得到 P ( E ) 的表达式 如下： 

P < = P ( E ) = P ( E \ H ) P ( H ) + P { E \ H C ) P { H C ) = pP ( E \ H ) + (1 - p ) P ( E \ H c ) 

现在,假定第一次硬币为正面朝上，第一次打赌结束后的状 态是： A 有了 i + 1 
元，而 B 有 N-(i + l ) 元.因为随后的抛掷都同前面独立并且正面朝上的概率都为 
p , 因此，从该时刻开始， A 贏得所有钱的概率等同于这种 情形： 一开始 A 有 i + 1 
元而 B 有 AT - (i + 1) 元.因此 P { E \ H ) = P i +1 . 类似地, P ( E \ H C ) = P *-, 这样，令 
g = l - p , 可以得到 

Pi = pPi+i + qPi -\ t = 1,2,••- ,N — \ (4.2) 

利用明显的边界条件 P o = 0 和仏=1,就可以求解 （4.2) 式. 由于 p + g = l , 
上式等价于 

pPi + qPi = pPi+i + qPi-i 
或者 a 

Pi+i - Pi = -(Pi - Pi - i ) t = l ,2,--, N-l (4-3) 

P 

这样，由 P 0 = 0,利用 （4.3) 式可以得到 

P 2 - Pi = - {Pi - Po ) = --Pi 

P P 
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P,-P2 = l{P2-P{] = [^) 2 Pl 




(4-4) 


Pa,-Pa ,- 1 = ^-i-Pn- 2 )=(^) Pi 
将 (4.4) 式中前 i - 1 个等式累加，可以得到 

«-«#[(?) + 吖 +"+(? 广 ] 

^ 1 _ ( q / pY 1 

Pi = 


或者 


- (9/P) 


Pi 如果^ / 1 


l iPl 

再利用事实= 1,可以得到 


如果^ 


^如果4 


因此 


Pi = 


- ( q / pY 


- ( q / p) n 


如果 P = 


如果 P # ; 


N 


(4-5) 


令 Qi 表示开始 A 有 i 元, B 有 TV - i 元，最后 B 贏得所有钱的概率，那么，由 
对称性，只需将 P 替换为 <7, i 替换为 N - i , 我们可以看出 
如果9# $ 


<3* = 


1 - ( p / q) n 
N- i 


如果 g = 


而且，因为 g = 1/2等价于 p = 1/2,因此当 g / l / 2 时，有 
- (q/pY 丄 1 - (p/q) n 
1 _ ( q / p )' 


Pi + Qi = 


- ip / q、 N 

P N - P N { Q / P) i , g N - q N ip / q ) N - 

— pN -qN _ 十 q N -p N 

p N - p N-i q i_ q N +q ipN-i ^ 

= pN- q N 

当 p = g = 1/2 时结论仍成立，因此我们有 



Pi + Qi = l 
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上式表明， A 和 B 中某一人将贏得所有钱的概率为1;或者说， A 的钱总在1与 
N -1 之间而赌博无休止地进行下去的概率为 0( 读者必须注意,这场赌博有三个可 
能结果，而不是两个，即或者 A 胜，或者 B 胜，或者谁也不胜.但我们刚才证明了最 
后一种结果的概率为 0.) 

现在给上述结论以数量上的说明.若开始 A 有5元，而 B 有10元，则当 
p = 1/2时, A 得胜的概率为1/3,而当 p = 0.6 时, A 得胜的概率猛增.为 



赌徒破产问题还有一种特殊情形，称为味博持续时间问题 （duration of play ). 
这个问题是1657年法国数学家费马向荷兰数学家克里斯第安 • 惠更斯提出的，后 
来被惠更斯解决.惠更斯解决的版本是这样的，设 A 和 B 每人有12枚硬币，他们 
以抛掷3个骰子的方法赌这 些钱： 若点数为 11( 不管谁掷敢子都可以)，则 A 给 B 
一枚硬币，如果点数为14,则 B 给 A —枚硬币.谁先贏得所有硬币谁就获胜.因为 
点数为 11} = 27/216及点数为 14} = 15/216，.由例 4 h 可以看出，对 A 而言， 
这正是 P = 12/45 , t = 12 ,N = 24 情形下的赌徒破产问题（例 4 k ). 一般的赌徒破产 
问题由数学家詹 姆士. 伯努利解决，其结果发表于1713年（他去世后的第8年). 

作为赌徒破产问题的应用，讨论如下的药品试验问题.设为治疗某种疾病，正 
在研制两种新药.新药 i 的治愈率为巧 ， i = 1,2. 然而，巧为未知的.我们希望知道 
Pi > P , 或 A > iV 试验是成对地，有序地进行的.对于各对病人，其中一人施以 
药1,另一人用药 2. 当其中一种药的治愈人数超过另一种药的治愈人数的一定数 
量时，试验就停止.令 

_ fl 第 j •对病人中用第1种药品者治愈了他的疾病 
Xj = [0 其他 

_ fl 第 j 对病人中用第2种药品者治愈了他的疾病 
K = \ o 其他 

设 M 是事先确定的正整数，试验在第 W 次时停止，其中 iV 是使下列两个等式中 
某一个第一次成立时的那个《 的值： 

Xi +-+ X n -{Yi + --+ Y n ) = M 
或 

Xi + • • ■ + x n — (yi + • •• + Y n ) = —M 

若 n 使第一个等式成立，就下 结论朽 > 巧，若 n 使第二个等式成立，则下结论 
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Pi < P - x . 


为了验证这个方法的好坏，我们需要知道利用这个方法导致作出错误结论的概 
率.即在假设朽 > 尸2是一组药的治愈率的真值的条件下，作出 “ P 2 > 巧”的错误 
决定的概率.注意到每一次试验的 结果： 当药品1有效，而药品2无效时，这个累 
计差会增加1,相应的概率为 Pi(l - P 2 ). 但如果药品2有效而药品1无效时，这 
个累计差会减少1，其相应的概率为 P 2 ( l - P ,). 当两种药的疗效相同时,这个累计 
差保持不变,其相应概率为 P X P 2 + (1 - P 1 )(l-P 2 ). 如果我们只考虑累计差变化的 


那些试验，则累计差以概率 

P = 累计差增1|累计差增1或减 1} 

增1,以概率 


Pi(l - Pi ) 

' Pi ( l - P 2 ) + P 2 ( l - Pi ) 


Pa(l - Pi ) 


Pi(l - P2 ) + P 2 (l - Pi ) 


减 1. 因此，作出判 断“巧 > 朽”的概率等于赌徒累计贏 M 元钱之前累计输 M 
元钱的概率（赌徒每次贏的概率为 p , 每次输贏为1元钱).在公式 （4.5) 中，令 
i = M,N = 2M, 这个概率为 

-y—) _1_ = _L_ 

1 + 7 m 


P { 下结论 P 2 > Pi } = 




卜(讲 


其中飞 = -^― = §1,例如，朽= 0.6, 巧= 0.4,则当 M = 5时，作出不正 

1 - 尸 尸 2(1 - 尸1) 

确判断的概率为0.017,当 M = 10时,这个概率降到 0.0003. ■ 

现在我们介绍一种解决非概率问题的概率方法.设有一个集合，我们希望知道 
在这个集合中是否至少有一个元素具有某一特征.例如，在一群鸡中，我们希望知 
道是否有鸡患禽流感.我们的方法是随机地从这一集合中取一元素，抽取的方法是 


使得这个集合中的每一个元素被抽取到的概率都大于 0. 现在考虎抽到的元素不具 
有该特征的概率.若这个概率为1，则在这个集合中没有元素有这个特征_若这个 
概率小于1，则在这个集合中至少有一元素具有这个特征. 

本节最后一个例子就是应用这个技术. 

例 4 m 首先给出 n 个顶点的完全图的 定义： 在平 
面上有 n 个点（称为顶点)，用条线段（称为边）将 
这些点联结起来•如图 3.3 表示了 3个顶点的完全图. 
图 3.3 3个顶点的完全图假设 ri 个顶点的完全图的每条边染成了红色或者蓝色_ 
一个有趣的问 题是： 对于给定的整数 A ：, 是否存在一个 
染色方法，使得该图上任意给定的 it 个顶点，其相应的条边不是同一颜色•通 


过概率讨论可以证明，如果 n 不是太大，答案是肯定的. 
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讨论 如下： 假设每条边独立等可能地染成红色或蓝色.也即，每条边为红色的 
概率为 1/2. 将这⑵个个顶点所组成的子集编号，定义事件 拉 ， i = 1，… 

如下： 

Et = {第《个*顶点集合的所有边颜色相同 } 

这样，由于 fc 顶点集合的条边的每条都等可能地染成红色或蓝色，因此,它们 
颜色相同的概率为 

P(E i ) = 2(-) 

由 

P ( U ^) p { Ei ) (布尔不等式） 

我们可得“至少存在一个 it 点集合，其所有边颜色相同”的概率为 p ( u ^), 满足 

因此，如果 G ^6) fc(fc_1>/2_1 < l 或者，等价于 〈 zw *- 1 )/ 2 — 1 , 则个点 
集合里，“至少存在一个 * 点集合，其所有的边颜色都相同”的概率小于 1. 因此, 
在前述 n 和 a ： 的条件下，“没有一个 / t 点集合，其所有边颜色相同”的概率为正数， 
这意味着至少存在一种染色方法，使得对任意&顶点集合，其所有的边染色不全相 
同. ■ 

注释 （4 上面的论证列出了关于71, fc 的条件，在这样条件之下，存在一种涂 
颜色的方法即可满足所要求的性质.但它并没有告诉我们如何涂颜色，使得所涂的 
颜色满足所要求的性质.（当然，可以随机地涂色，然后检査所涂的颜色是否满足所 
要求的性质，若不成，再重复一次，直到成功为止 .） 

( b ) 将概率引进那些纯粹是确定问题的方法称为概率化方法 (probabilistic 
method ®). 此方法的其他例子在理论习题24以及第7章的例 2 t 和例 2 u 中给出. 


3.5 P (-| F ) 为概率 

条件概率满足普通概率的所有性质.命题 5.1 证明了条件概率 P (£| F ) 满足概 
率的三条公理. 


①参见 N. Alon, J. Spencer 及 P. Erdos, The Probabilistic Method (纽约： John Wiley & 
Sons, Inc., 1992). 
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命題 5.1 ⑷0 < P(S|F) < 1; (b) P { S \ F ) = 1； (c) 若 = 1，2，“. 
为互不相容事件列，则 

p[[}E i \F)=Y i P(E i \F) 


证明： 为了证明 （ a ), 我们只要证明0 彡 P { EF )/ P ( F ) < 1即可.不等式左边是 
显然的，而不等式的右边成立是因为 EFCF 成立意味着 P ( EF ) ^ P(F). (b) 成 


立是因为 


P (, S \ F ) = 


P { SF ) 

~ p ( fT 


P ( F ) 

P ( F ) 


(c) 成立是因为 

oc P (( U ^) F ) P ( U ^) 

P {\ J ^ F ) = — fb ) -= F ( F ) - 




P ( EiF ) 


P ( F ) 




因为 (Ci £ 0 F = 


其中倒数第二个等式成立是因为 EiEj = 0,这意味着 EiFEjF = 0 . 

如果我们定义 Q ( E ) = P ( E \ F ), 根据命题 5.1, Q ( E ) 可认为是关于 S 中事件 
的概率函数.因此,前面证明的关于概率的命题它都 满足. 举例说，我们有 


Q{Ei Uf^) = QiEi ) + Q ( E 2 ) - Q { E x E 2 ) 


或者等价地, 


P(£iU Ea|F) = P(Ei\F) + P{E2\F) - P{E x Ei\F) 

而且，如果我们再定义条件概率 0(^1 1£^) 如下： QiExlEh ) = Q (岛五 2 )/(?(玖)，根 
据 （3.1) 式可得 

Q(Bi) = Q(E 1 \Eh)Q{E 2 ) + Q ( 五坞 )Q( 琛） （ 5.1) 


由于 


Q ( E !\ E 2) 


QjEjEh ) 
Q (丑 2) 


P^EzlF) P { E 1 E 2 F )/ P ( F ) 
P ( E 2 \ F ) P ( E 2 F )/ P ( F )~ 


PiE^EhF) 


我们可看出 （5.1) 式等价于 


P(Ei|F) = P^xl^FJP^IF) + PiErl ^ P ^ F ) 
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例 5 a 考虑例 3 a , 保险公司认为人可以分为不同的两类，一类是易出事故的， 
另一类是比较谨慎的.在任意给定的一年内，易出事故的人将发生事故的概率为 
0.4, 而对比较谨慎的人来说，此概率为 0.2. 若已知某新保险客户在第一年已经出 
过一次事故，问他在保险有效的第二年又出一次事故的条件概率是多大？ 

解： 如果令4表示“该保险客户是易出事故的人”这一事件，而次 , i = 1，2表 
示“他在第 i 年出一次事故”.那么，以他是不是易出事故的人为条件,可以算出所 
求概率 P ( A 2 \ A !) 如下： 

P ( A 2 \ Ai ) = P ( A 2 \ AA 1 ) P ( A \ A 1 ) + P { A 7 \ A c M ) P { A c \ A ^) 


而 


P { A \ M ) 


PjA . A ) 

"P04O" 


P(AM)P(A) 

~ pIaT )~ 


但是，例 3 a 中己经假设 P ( A ) = 3/10, 且算出了 P { A {) = 0.26, 因此 


P ( A \ A x ) 


0.4 x 0.3 
0.26 


6 

13 


从而 


P ( A c \ A l ) = l - P ( A \ A 1 ) = ^ 


由于 P ( A 2 \ AA !) = 0.4 以及 P ( A 2 \ A C A !) = 0.2, 我 Cl 得到 

P ( A a | i 4 i ) = 0.4 x ^+0.2 x 0.29 


例 5 b —只母猩獲生了一只幼猩握，但是，却不能断定两只公猩猩究竞哪一只 
是父亲.在进行基因分析之前，有迹象表明第一只公猩猩为父亲的概率为 P ， 第二只 
为父亲的概率为 1- P . 从这三只猩猩身上获得的 DNA 表明，对于一个特殊的基因 
组，母猩猩具有基因对 ( A . A ), 第一只公猩猩具有基因对 ( a , a ), 而第二只公猩猩具 
有基因对 ( A , a ). 幼猩猩出生后，具有基因对 ( A , a ), 第一只公猩猩是父亲的概率是 
多大？ 


解： 令所有概率都是以“母猩猩有基因对 ( A . A ), 第一只公猩猩具有基因对 
( a , a ), 第二只公猩猩具有基因对 （ A , a )” 为条件的条件概率.又令从表示第 i 只公 
獲握为父亲这一事件 , i = 1,2.令 B A , a 表示幼猩猩具有基因对 ( A , a ) 这一事件，那 
么如下可得到 P ( M 1 [ B A , a )： 


P(MiD 


P(Mig A ,») 

尸(丑 a .«) 


_ P ( B a ,>| Mi ) P ( Mi ) _ 

+ P(B A ,a|M 2 )P(M 2 ) 


1 x p _ 2 p 

1 x p + 1/2 x (1 — p ) 1 + p 


由于当 p < 1 时 2 p /( l + p ) > p , 我们可以看出幼猩猩的基因对为 ( A , a ) 这一信 
息增加了第一只公猩猩为父亲的概率.这点很直观，因为相对于 M 2 来说，成 
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立的条件下，幼猩猩的基因对为 （ A , a ) 的可能性更大（各自的条件概率分别为1 
和 1/2). ■ 

下面的例子研究游程的理论中的一个问题. 

例 5 c 设有一个独立重复试验序列，每次成功的概率为 p , 失畋的概率为 g = 
1- p . 我们希望计算长度为 n 的成功游程先于长度为 m 的失败游程的概率. 

解 ：记五 为事件“长度为 n 的成功游程先于长度为 m 的失败游程”.以第一 
次试验结果为条件，得到 


P { E ) = pP ( E \ H ) + qP ( E \ H c ) (5.2) 

其中 H 表示第一次试验成功.现在假定第一次试验成功，为了使得长度为 n 的成 
功游程先出现，我们希望接着 n - 1次试验均为成功. 现在令 F 表示事件“第2次 
到第 n 次试验均成功”.以 F 为条件，我们得到 


P ( E \ H ) = P ( E \ FH ) P ( F \ H ) + P (£| F c Jf ) P ( F c | H ) (5.3) 

显然， P { E \ FH ) = 1. 另一方面，若发生，说明第一次试验成功，但在后面的 
n -1 次试验中，至少有一次试验失败.此时，前面的成功已经失去作用，相当于 
从失败开始，因此 P { E \ F ^ H ) = P ( E \ H C ), 由试验的相互独立性，可知 P ( F \ H ) = 
P ( F ) = p n ~ 1 . 因此，由 (5.3) 可知 

P ( E \ H ) = p "- 1 + (1 - p «- i ) p ( E | if c ) (5.4) 

现在考虑令 G 表示亊件“第2次试验直到第 m 次试验均失畋”.我们 
得到 


P ( E \ H C ) = P ( E \ GH C ) P ( G \ H C ) + PiE ^ H ^ PiG ^ H 0 ) (5.5) 


GH C 表示前 m 次试验均失败，故 P { E \ GH C ) = 0.当发生时，所有以前的失败 
已经失去作用，相当于从成功开始，即 P { E \ G C H C ) = P ( E \ H ). 又由于 P ( G C | H C ) = 
P ( G c ) = l - g m - 1 ,(5.5) 化为 

P { E \ H C ) = (1 - q m ~ l ) P ( E \ H ) (5.6) 


由 （5.4) 和 (5.6) 可得 

nE\H) = pn _ 1 + q S,~[^ qm -^ P{E\Hn = 


最后得到 


P { E )= pP ( E \ H )+ qP ( E \ H c ) 


p n + gp n ~ 1 ( l - g m ~ 1 ) p n - 1 ( l - g m ) 

pn-l + qm-1 _ pn-lqtn-l pn—1 + qm-1 _ pn-lqm—1 


(5.7) 


由对称性,可知长度为 m 的失败游程先于长度为 n 的成功游程的概率也可用 （5.7) 
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式进行计算，不过公式中 m 和 n 对换, p 和 g 对换. 


长度为 m 的失败游程出现在长度为 n 的成功游程之前} 


g m-l (1 _ p n) 
+p n_1 — g m-1 p n_1 


(5.8) 


由于 （5.7) 和 （5.8) 之和为1，可知长度为 n 的成功游程和长度为 m 的失败游程终 


有一个会出现. 


举例，掷一枚均匀的硬币，长度为 2 的正面游程先于长度为3的反面游程的概 
率为7/10,长度为2的正面游程先于长度为4的反面游程的概率为 5/6. _ 

例 5 d 再次研究配对问题（第 2 章例 5 m ), 这次运用条件概率解答问蹕. 

例 5 d 在一次聚会上, n 个人摘下他们的帽子，然后把这些帽子混合在一起, 
每人再随机选择 一顶. 如某个人选中了他自己的帽子，我们就说出现了一个配对 • 


以下事件概率是多大？ 


( a ) 没有 配对. （ b ) 恰有 A : 个配对. 

解 :⑷令 B 表示“没有配对”这一事件，它显然与 n 有关,因此可记/>„ = P{E). 
以第一个人是否选中自己的帽子 （ 分别记为 M 和 M e ) 为条件，有 


P n = P(E) = P{E\M)P{M) + P(E\M C )P(M C ) 

易知 P{E\M) = 0,因此 

P n = P { E \ M C )^ - (5.9) 

P(E\M C ) 是在已知 n - 1 个人中有一个特殊的人（此人的帽子已被第一人选走）必 
定选不到自己帽子的条件下，这 n - 1个人选 ri -1 顶帽子没有配对的概率.此处有 
两种互不相容的选取 方式： 该特殊的人没有选中第一人的帽子且其余的人中也没 
有 配对； 该特殊的人选中了第一人的帽子,且其余的人中也没有配对.前者的概率 
正是只(此时可把该特殊的人理解成第一人)，而后者的概率为 [ l/(n - 1)] P „_ 2 . 
这样，我们得到 

P(E\M C ) = P n -l + 打上工 Pn-2 

于是由 （5.9) 式可得 

Pn = —Pn-l + -Pn-2 
n n 

或等价地有 

Pn - Pn-l = —-(^ n-l - Pn-2) (5.10) 

n 


但是，由于表示 n 个人在他们的帽子中随机地选一顶但没有一人选中自己的帽 
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子的概率,我 们有朽 =0, P 2 = l /2, 从而由 （5.10) 式 可得： 


P3- P2 = ~ 


P2~Pl 


_5T 或 P3 = 2! 

-丄或 p i = - - L + J _ 

4! ^ 4 2! 3! 十 4! 

-般地，我们有 

Pn= ir-ir + 务一 

( b ) 为了计算正好有 fc 个配对的概率，先考虑固定的某 fc 个人,只有他们选中 
自己的帽子的概率为 

>-印 ， 

n ! 


Pi - Pi = 


P3 - P2 


T^n-fc = 


~Pn-k 


n n — 1 n — (fc — 1) 

其中 P n - k 是已知 fc 个人选中自己的帽子,其余 n - fc 个人在他们自己的帽子中选 
取而没有配对的条件概率，再因这 fc 个人有09种选法，故正好有&个配对的概 


率为 


Pn-k 21~31 + 
~kF ~ k \ 


, (~ l) w - fc 

(^)T 


概率论的另一个重要概念是事件的条件独立性.我们称事件玢和玢对于给 
定的事件尸是条件独立的 (conditionally independent ), 如果己知尸发生的条件下， 
E x 发生的概率不因 E 2 是否发生而改变.确切地说，称玢与氏在给定 F 发生之 
下是条件独立的，如果 

P { E l \ E 2 F ) = P { E l \ F ) (5.11) 

或等价地， 

TO ^| F ) = P ( E x \ F ) P {. E 2\ F ) (5.12) 


条件独立的概念容易推广到两个以上事件的情形，我们把它留作习题. 

读者会发现，条件独立性的概念在例 5 a 中已经用过了.在那里，我们 假定： 
在己知保险客户是否为易出事故的人的情况下，“他在第 i 年 , i = l ，2，.〃， 出一次 
事故”这些事件是条件独立的.下一个例题，有时也称为拉普拉斯继承准则，进— 
步解释条件独立的概念. 

例 5 e (拉普拉斯继承准则）盒中有 fc + 1枚不均勻的硬币，抛掷第 i 枚硬币时， 
其正面朝上的概率为 */*,* = - , k . 从盒子中随机取出一枚硬币，并重复地抛 

掷，若前 n 次抛掷结果都为正面朝上，问第 n +1 次结果仍为正面朝上的概率是 
多大？ 

供••令 Q 表示“开始取出的是第 i 枚硬币”这一事件 ， i = 0,1,…， fc , 表示 
“前 n 次结果都为正面朝上”， H 表示“第1次抛掷出现正面朝上”.所求概率 



/»(哪）为 


P{H\F n ) ^P(H\F n Ci)P(Ci\F n ) 


现已知取出的是第 i 枚硬币，假设各次抛掷的结果是条件独立的，每次出现正面朝 
上的概率为 i / Jk ， 于是有 


P(CjF n ) P(F n lCi)P(Ci) 


( i / fc )"[ l /( A : + l)l 


亡 PiF^PiCj) ^>7*r[i/(* + 1)! 


但当充分大时，可利用积分近似 




故对很大的 fc 有 


例 5 f (序贯地补充信息）假设有 n 个互不相容且完全的假设，其初始概率[有 
时也称为先验 ( prior ) 概率]为 P(Hi), Ei=iP(Hi) = l. 现在假设得到 信息： 事件五 
发生, 那么执 成立的条件概率为[有时称为私的后轮 ( posterior ) 概率 j : 

戶_= (5.13) 

现在,假设我们首先知道五 i 发生，然后私发生.那么，如果仅仅得知第一条信息 
时 ，私 为真假设的条件概 率为： 

p («,| £l )-— ^ —- [順两 )m) 
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而如果得知两条信息时 ，历 为真假设的条件概率 PmEiEh ) 可以如下 计算: 




P(gi.E 2 |g i )P(g i ) 


然而，或许有人疑惑，可否这样计算 P ( Hi \ E ! Eh )： 利用 （5.13) 式的右边，将£；替换 
为 及, 将 P ( Hj ) 替换为 PiHjlE^j = 1, 也即，将 PiH ^ E^j > 1 作为先 
验概率，将 私 作为新近得到的信息，然后利用 （5.13) 式来计算后验概率？ 

解： 上述算法是合理的，条 件是： 对每一个 j = !,■■■, n , 在给定•下，事件 
玢和恥是条件独立的.如果这样，那么 


尸职氏 ㈣= P(E^\H j )P(E 1 \H j ) j = 1，…， n 


这样， 


PmExE ^) 


p(em 


P(Eh\H i )P(H i \E 1 )P(E 1 ) 

P(EM 


PjEhlH^PjEtHj) 
~ PiEiE ^)^ 

QM 


其中 <3(1,2) = PiE ^/ PiEi ), 由于上式对所有 i 都成立，我们将上式对 i 求和 


得到 


说明 




Q(l,2) = Y t P(E2\H i )P{H i \E 1 ) 


这样可得结果为 


PmExE ^) = 


P{E 2 \H i )P{H i \E 1 ) 


举例来说，假设有两枚硬币，选择一枚抛掷 ，令风 表示选中了第 i 枚硬币, 
z = l ,2, 并假设选中第 i 枚硬币后抛掷，正面朝上的概率为 Pi ，i = l ，2 •令勾 表示 
“对于选中的硬币的第 j 次的抛掷结果”.抛掷以后 ，即玢 发生以后,只需将 P ( Hi ) 
进行修正，得到 P ( Hi \ Ei ). 若以后还有新的试验结果氏，此时只需将 P (私 |玢） 进 
行修正,得到将 PiHilE ^) 重新写成 P ( Hi ), 即忘掉它的历史.每次 


得到新的试验结果,只需将修正了的 pm 再一次进行修正即可,而不必考虑修正 
的历史. ■ 


小 结 

对于任意事件五和已知尸发生的条件下，五发生的条件概率记为 P (£；| f ), 



定义为 如下: 
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P (網 


P ( EF ) 


等式 P ( Ei £；2 • ■ 〜) = P ^ P ^ Ei ) ■■- P ( E n \Ei - - - £；„_!) 称为概率的乘法规则. 

—个有用的等式 P { E ) = P { E \ F ) P { F ) + P { E \ F C ) P { F C ) 可用来通过以 F 是否 
发生为条件计算 P ( E ). 

P ( H )/ P ( H C ) 称为事件 H 的优势.等式 

P ( H \ E ) P ( H ) P ( E \ H ) 

P { H C \ E ) = P ( H C ) P ( E \ H C ) 

说明了当得到一个新的证据 E 后， H 的优势等于原来的优势值乘以当好成立时 
新证据发生的概率与 H 不成立时新证据发生的概率的比值. 

令 = l,-.,n 为互不相容事件列，且它们的并为整个样本空间，等式 

P{FAE)= ^m)wi. 

亡戶剛剛） 

»=1 

称为贝叶斯公式.如果亊件 = l,--,n 为一组假设，那么贝叶斯公式说明了如 
何计算当新证据成立时,这些假设成立的条件概率. 

如果 P ( EF ) = P ( E ) P ( F ), 那么我们称事件和 F 是独立的.该等式等价于 
P ( E \ F ) = P (£) 或 P ( F \ E ) = P ( F ). 也即，如果知道其中之一的发生并不影响另一 
个的发生的概率，那 么五和 F 独立. 

事件玢，…，£：„称为独立的，如果对任何子集 E h '…、 E ir 、有 


P { E il - E ir ) = P ( E il )-- P { E ir ) 

对于任一给定事件 F , P ( E \ F ) 可以认为是样本空间的事件的概率函数 • 


习 题 

1. 掷两枚均匀骰子，求已知两枚骰子点数不同的条件下，至少有一枚点数为6的条件概率. 

2. 掷两枚均匀骰子，求给定两枚骰子点数之和为 i 的条件下，第一枚点数为6的条件概率. 
计算 i 取值从2到12的所有情况. 

3. 利用公式 (2.1), 计算在-手桥牌里，南北两家持有总共8张黑桃的条件下，东家持有3张 
黑桃的条件概率. 

4. 掷两枚均匀骰子,在点数和为 i 1 t = 2,3, - - ,12的条件下，至少有一枚点数为 6 的条件概 
率是多大？ 

5. 坛子里有6个白球9个黑球.如果无放回随机抽取4个，问头两个是白球后两个是黑球 
的概率是多大？ 
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6. 坛子里有12个球，其中8个 白球. 从中有放回（无放回）抽取4个,求已知抽取的球中正 
好有3个白球的条件下，第一个球和第三个球是白球的条件概率（有放回和无放回情形下 
分别计算). 

7. 国王来自有两个孩子的家庭，问另一个孩子是他姐妹的概率是多大？ 

8. 某夫妇有两个孩子，已知老大是女孩的条件下两个孩子都是女孩的条件概率是多大？ 

9. 假设有3个坛子，坛子4有2个白球4个红球，坛子 B 有8个白球4个红球，坛子 C 
有1个白球3个红球,如果从每个坛子各取一球，问正好取了两个白球的条件下，从坛子 
A 里取的是白球的条件概率是多大？ 

10. 随机无放回地从一副52张牌里面抽取3张，已知第二张和第三张都是黑桃，求第 一 张是 
黑桃的条件概率. 

11. 随机无放回地从一副52张牌中抽取2张，令 B 表示“两张都是表示“抽 
中了黑桃 ‘ A ’ ”，令>1表示“至少抽中了一张 ‘ A ’ 

( a ) 求 P ( B \ A . y , ( b )* P { B \ A ). 

12. 某大学毕业生欲参加前三场稍算师考试.她将在6月份参加第一场考试.若通过了，则在 
7月份参加第二场.而若又通过了，则参加8月份的第三场.如果在某场考试失败了，则 
不允许参加剩下的考试.她通过首场考试的概率为 0.9; 如果她通过了首场考试，则通过第 
二场考试的条件概率为 0.8; 如果通过了前两场，那么通过第三场的条件概率为 0.7. 

( a ) 她通过全部三场考试的概率是多大？ 

( b ) 己知她没有通过全部三场考试的条件下，她在第二场考试失败的条件概率是多大？ 

13. 考虑一副52张牌（有4张 “ A ”） 随机平均分给4家，每家13张，我们感兴趣于每家 
都有一张 “ A ” 的概率 p , 令瓦 表示“第 i 家恰好有1张 ‘ A ’ ”，利用乘法规则计算 
P = P{EiE2E3Ea). 

14. 坛子里最初有5个白球7个黑球.每次取出一个球,记下它的颜色并放回坛子，同时再放 
入同颜色的2个球.计算如下 概率： 

( a ) 前两个球是黑色，接下来两个球是 白色； （ b ) 抽取的前四个球当中，正好有2个黑球. 

15. 吸烟的怀孕妇女宫外孕的概率是不吸烟妇女的两倍.如果有32%的孕妇吸烟，那么宫外 
孕孕妇吸烟的概率是多大？ 

16. 数据显示, 98%的婴儿分娩是安全的.然而有15%的分娩是剖腹产.当采用剖腹产时，婴 
儿的生存概率为96%.问采用非剖腹产的孕妇，其婴儿的生存概率是多大？ 

17. 某个社区，36%的家庭有一条狗，22%的家庭既有 条 狗，又有一只猫，另外，30%的家 
庭有一只猫 .求： 

( a ) 随机选择一个家庭，为既有猫又有狗的概率； 

( b ) 随机选择一个家庭，己知该家庭有猫的条件下，还有一条狗的条件概率. 

18. 某城市中，46%的人无党派, 30%的人属于自由党，24%的人属于保守党_在最近一次地 
方选举中，35%的无党派人士、62%的自由党员、58%的保守党员参与了选举.随机选择 
一位选民，假定他参与了地方选举，求以下 概率： 

( a ) 他是无党派 人士； （ b ) 他是自由党 党员； 

( c ) 他是保守党党员？ （ d ) 有多少比例的 人参与 了地方选举？ 



19. 参加过一个“戒烟班”的人，有48%的女性和37%的男性在结束后一年内坚持没有吸烟， 
这些人参加了年末的庆功会.如果一开始，班里有62%的男性 ，问： 

( a ) 参加庆功会的女性有多大比例？ 

( b ) 参加庆功会的人数占全班的百分比是多少？ 

20. 某大学里, 52%的学生为女生, 5%的学生专业为计算机科学，2%的学生为计算机科学专 
业的女生.如果随机挑选一名学生，求以下条件 概率： 

( a ) 在已知该学生主修计算机科学的条件下，该生为女生的条件 概率； 

( b ) 已知该生为女生的条件下，该生主修计算机科学的条件概率. 

21. 总共有500对职业夫妇参与了关于年薪的调査，以下是调査 结果： 



低于25 000美元 212 198 

高于25 000美元 36 _54 


举例说明，其中有36对夫妇，赛子年薪超过25 000美元,而丈夫低于25 000美元.如果 
随机挑选一对夫妇，求以下 櫬率： 

( a ) 丈夫年薪低于25 000 美元； 

( b ) 丈夫年薪*于25 000美元的条件下，妻子年薪超过25 000美元的条件 概率； 

( c ) 丈夫年薪低于25 000美元的条件下，妻子年蘄超过25 000美元的条件概率. 

22. 分别掷一枚红、 SS 、 黄色骰子（都是6面)，我们感兴趣于蓝骰子点数小于黄敗子点数，而 
黄骰子点数小于红骰子点数的概率.也即，令分别表示篮、黄.红殽子的点数，我 
们感兴趣 P ( B < Y < R ). 

( a ) 没有两个骰子点数一样的概率是多大？ 

( b ) 已知没有两个骰子点数一样的情况下， B < Y < R 的概率是多大？ 

( c ) 求 P{B < Y < R ). 

23. 坛子 I 有2个白球4个红球,而坛子 II 有1个白球1个红球,随机从坛子丨里取--个球 
放入坛子 II ,然后随机从坛子 II 中取一个球， 

( a ) 从坛子 II 中取出的球是白球的概率是多大？ 

( b ) 己知从坛子 II 中取出的是白球，问从第一个坛子中取出的放入第 H 个坛子的球是白 
球的条件概率是多大？ 

24. 在一个坛子里放入两个球，假设在放入之前，每个球分别以概率为1/2涂成黑色，以概率 
为1/2涂成金色.假设两个球的涂色是相互独立的. 

( a ) 假设你己知金色的颜料己经用过（也即至少有一个球涂成了金色)，计算两个球都涂 
成金色的概率. 

( b ) 假设坛子倒了，一个球掉了出来，是金色，那么其中两个球都是金色的概率是多大？并 

解释. 

25. 以下方法用来估计100 000人的城镇里的50岁以上的人口的数 量:“ 当你在街上散步时， 
数一数你碰到的超过50岁的人数，再算出它们占你遇到的人的百分数，这样做几天后，用 
100 000去乘得到的百分数就是所求的估值，”对这个方法作出你的评论. 
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提示： 设这个城市中超过50岁的人所占比例为 p , 另外，令 m 表示一个50岁以下的人 
花费在街上的时间所占的比例， a 2 表示一个超过50岁的人的相应比值,这个方法估计的 
是什么量？什么时候这个估计值近似等于 p ? 

26. 假设有5%的男性和0.25%的女性为色盲，并假定男性和女性的数量相等.随机选择一 
个色盲的人，他是男性的概率是多大？如果男性的数量是女性的两倍呢？ 

27. —公司所有员工都开车去上班 •公 司希望估计出每个车内乘员的平均数.下面提供的方法 
中，哪一个是正确的？并给出解释. 

( a ) 随机地找 n 个人，问他们所乘的车内有多少人，求出其平 均值； 

( b ) 随机地选 n 辆车，数-数车内的人敫，然后求平均值. 

28. 一副52张牌扣在桌上，每次翻开一张，直到出现第一张 “ A ” . 已知第一张 “ A ” 出现在第 
20张翻牌，问接下来的牌是以下牌的条件概率是多大？ 

( a ) 黑桃 “ A ”, （ b ) 梅花2_ 

29. 盒子里有15个网球，其中9个球还没用过.随机抽取3个，用它们练球，之后放回盒子. 
随后，又随机从中再抽取3个，求其中没有一个球被用过的概率是多大？ 

30. 两个盒子，一个里面有黑白弹子各一个，另一个有2个黑弹子，1个白弹子.随机挑 选-个 
盒子，再随机从中取出一个弹子，问是黑弹子的概率是多大？己知弹子是白的条件下，选 
中的盒子是第一个盒子的条件概率是多大？ 

31. 阿奎娜夫人接受了一次痛症活体组织检査.她不愿意这次检査影响自己周末的情绪.若她 
告诉医生，只有好消息时才打电话通知结果.这样，当医生不打电话时，她仍然可下 结论： 
她的结果是不好的.学过概率的阿奎娜夫人要求医生，首先掷一枚硬币，若硬币为正面朝 
上，那么当检验结果是好消息时，医生就及时通知她，当检验结果是坏消息时，就不通知 
她.若硬币为反面朝上时，医生就不必打电话.这样，即使医生不打电话，并不意味着“一 
定是坏消息”.记£«为检査结果为癌症的概率，为医生不打电话的条件下，检验结果为 
癌症的条件概率. 

( a ) 和哪个大？ （ b ) 求出沒和 a 之间的关系，验证 （ a ) 中结论. 

32. 某家庭有 j 个孩子的槪率为其中 pi = 0.1 ,pa = 0.25, pa = 0.35, p 4 = 0.3. 随机从该家 
庭挑选•个孩子，已知这孩子为该家庭里最大的孩子，求该家庭有以下数最孩子的条件概 
率： 

( a ) 仅仅一个 孩子； （ b ) 有4个孩子. 

如果随机挑选的一个孩子是该家庭里最小的孩子，重做 （<») 和 （ b ). 

33. 在下雨天，乔以概率 0.3 迟到，而晴天，乔迟到的概率为 0.1. 根据天气预报，明天下雨的 
概率为 0.7. 

( a ) 求出乔明天按时上班的概率. 

( b ) 实际上乔在第二天是准时上班的，问第二天下雨的概率是多少？ 

34. 在例 3 f 中，假定新的证据仅仅表明罪犯具有该特征的可能性为90%.这种情形下，嫌疑 
犯确实犯罪的可能性是多大（假设嫌疑人具有该特征)？ 

35. 圣诞节送给孩子的礼物都是被藏起来的.通常以 0.6 的概率是由母亲藏的，以 0.4 的概率 
是由父亲藏的.当母亲藏的时候，以70%的概率藏于楼上, 30%的概率藏于楼下.而父亲 
藏的时候，则以相等的可能性藏于楼上或楼下. 
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(a) 礼物放在楼上的概率有多少？ 

( b ) 己知礼物放在楼下，这个礼物是由父亲藏的概率有多大？ 

36. 商店 A . B . C 各有50、75和100名员工，其中50%, 60%和70%是女性.我们假定每个 
员工的辞职是等可能的，而且不分员工的性别.有个员工辞职了，而且是女性，问她在 C 
店工作的概率是多大？ 

37. (a) 某赌徒口袋里有一枚均匀硬币，还有一枚两面都为正面的硬币.他随机从中取出—枚 

并掷之，发现是正面朝上，问掷的是对称硬币的概率是多大？ 

(b) 假设他将那枚硬币再掷一次，发现还是正面朝上.那么它是对称硬币的概率是多大？ 

( c ) 假设他第三次掷那枚硬币，发现是反面朝上.那么它是对称硬币的概率是多大？ 

38. 坛子 A 里有5个白球7个 黑球. 坛子 B 里有3个白球12个黑球.我们投掷一枚对称 
硬币，如果结果为正面朝上，从 A 里取一个球，而如果结果为反面朝上，则从 B 里取一个 
球.假设取出的是一白球，问硬币是反面朝上的概率是多大？ 

39 . 在例 3a 中，己知投保人第一年内没发生亊故，问第二年发生亊故的条件概率是多大？ 

40. 坛子里有5个白球, 7个红球.考虑如下方式取出3 个： 每一步取出一个，并记下颜色，然 
后把它放回坛子，同时再放进一个同颜色 的球. 求取出的3个球满足下列条件的 概率： 

(a) 没有 白球； （b) 只有 1 个白球； （ c ) 是 3 个 白球； （d) 刚好有 2 个白球. 

41. 一副洗好的牌分成两半，各26 张. 从其中一半里取出1张，发现是 “ A ” . 然后将它放入 
另一半里，并将这27张牌重新洗匀，从中取出一张.计算这张牌是 “ A ” 的概率. 

提示： 以取出的是否是放进去的那一张为条件 • 

42. A . B . C 三个厨师烘烤-种饼，烤坏的槪率分别为 0.02, 0.03 和 0.05. 在它们工作的餐厅 
内，这种饼， A 烘的占50%, B 烘的占30%, C 烘的占20%.问在烤坏的饼中，由 A 烘烤 
的占多大比例？ 

43. 盒子里有3枚硬币，第一枚两面都为正面，第二枚为正常硬币，第三枚是不对称的，它出 
现正面朝上的概率为75%.从中随机挑一枚硬币并探出去，发现是正面朝上，问它是两面 
都为正面的概率是多大？ 

44. 监狱看守通知三个囚犯,在他们中要随机选择--个处决，而把另两个释放.囚犯 A 请求看 
守秘密地告诉他，另外两个囚犯中谁将获得自由， A 声 言:“ 因为我已经知道他们两人中 
至少有一个获得自由，所以你泄漏这点消息是无妨的 •” 但是看守拒绝回答这个问题，他^ 
A 说 :“如 果你知道了你的同伙中谁将获释，那么，你自己被处决的概率将由1/3增加到 
1/2,因为你就成了剩下的两个未决定命运的囚犯中的一个了•”对于看守的上述理由，你 
怎么评价？ 

45. 假定有10枚硬币，掷第 i 枚硬币正面朝上的槪率为*/10,*=1,2, - - ,10. 先随机选择一 
枚硬币掷出，结果为正面，问它是第5枚硬币的概率是多大？ 

46. 某年内，投保的男司机索赔的概率为 Pm , 而投保的女司机索路的概率为 P /, 其中 P / 一 Pm . 
男司机占的比例为 a ,0< a < l . 随机挑选一名司机 ，令九 表示“该司机第 i 年索赔”这 
一事件，证明 

P ( A 2 | Ai ) > P ( A 0 

给出上述不等式的直观解释. 
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47. 坛子里有5个白球，10个黑球.掷一枚对称骰子，掷出几点就从坛子中取几个球，取出的 
球都是白球的概率是多大？在取出的球都是白球的条件下，掷出 的锻子 点数为3的条件 
概率是多大？ 

48. 两个外形一样的橱柜都有2个抽屉 . A 櫥柜每个抽屉里有一个银币， B 橱柜有一个抽屉 
里有一枚银币，另一抽屉有枚金币.随机挑选…个櫥柜，打开其中一个抽屉，发现是一枚 
银币，求另一个抽屉里也是银币的概率. 

49. 前列腺癌是男性中比较常见的一种痛.男性是否患有前列腺癌，医生经常进行一项检査， 
测量仅由前列腺分泌的 PSA(prostate specific antigen ) 蛋白质水平.这种检査是出了名 
地靠不住.亊实上，一个未患前列腺痛的男性其 PSA 水平偏高的概率为 0.135, 而他确实 
有癌症的情况下，此概率增至 0.268. 如果一个医生用其他方法诊断该男士有70%的可 
能患有前列腺癌，给定下列条件下，他患有癌症的条件概率是多大？ 

( a ) 检査指标为高水平. ( b ) 检査指标不为高水平. 

若假设医生最初有30%的把握认为他有痛症，重做以上问题. 

50. 某保险公司把被保险人分成如下三 类:“ 好的”、“一般的”、“高风险的”.统计资料表明， 

对于上述三种人而言，在一年期内卷入某一次亊故的概率依次为 0.05,0.15 和 0.30. 如果 
“好的”被保险人占人口的20%, “一般的”占50%, 风险的”占30%.试问在固定的一 

年中出亊故的人口占多大比例？如果某被保险人在1997年没出亊故，他是“好的” （“一 
般的”）概率是多大？ 

51. 某员工为了找到新工作，请其领导写封推荐信.她估计如果得到了强有力的推荐，那么有 
80%的可能找到 工作； 如果得到了一般的推荐，那么40%的可能找到 工作； 如果得到比 
较弱的推荐，那么只有10%的可能找到工作.而且她估计她得到强有力的推荐、一般的 
推荐和较弱的推荐的概率分别为 0.7,0.2,0.1. 

( a ) 她有多大的把握认为她会找到新工作？ 

( b ) 己知她找到了新工作，她得到了强有力的推荐、一般的推荐以及较弱的推荐的条件概 
率各是多少？ 

( c ) 己知她没找到新工作，她得到了强有力的推荐、一般的推荐以及较弱的推荐的条件概 
率各是多少？ 

52. 一个髙中学生非常焦急地等待大学录取通知书.她估计在她被录取（不被录取）的条件下, 
在下周各天内收到信件的概率如下表. 


H 期 

P (收到倌件I被 录取） 

P (收到信件丨未录取） 

周一 

0.15 

0.05 

周二 

0.20 

0.10 

周三 

0.25 

0.10 

周四 

0.15 

0.15 

周五 

0.10 

0.20 


同时，估计被录取的概率为 0.6. 

( a ) 星期一收到信件的概率是多大？ 

( b ) 星期一没收到信件的条件下，星期二收到信件的概率？ 
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( c ) 若星期三以前未收到信件，她被录取的概率有多大？ 

( d ) 如果她在星期四收到信件，她被录取的条件概率有多大？ 

( e ) 本周她没收到信件，问她被录取的条件概率有多大？ 

53. 并联系统当其中只要有一个元件有效时就工作正常.考虑一个有 n 个元件的并联系统， 
假设每个元件独立地有效工作的概率为1/2,计算已知系统工作正常的条件下，元件1工 
作正常的条件概率. 

54. 在下列 （ a ) 到 （ e ) 的情形中，如果你必须建立一个关于亊件£和 f 的数学模型，哪种情 
形你可认为它们是独立的？试解释原因. 

( a ) E 表示某个女商人是蓝眼睛，而 F 表示她的秘书也是蓝眼睛. 

( b ) E 表示某教授有辆汽车， F 表示他的名字出现在电话簿里. 

( c ) E 表示某男人身髙低于6英尺，而 F 表示其体重超过200磅. 

( d ) E 表示某妇女生活在美国，而 F 表示她生活在西半球. 

( e ) E 表示明天会下雨，而 F 表示后天还会下雨. 

55. 某课觉里己知有4个一年级男生，6个一年级女生，还有6个二年级 男生. 如果从中随机 
选择一个学生，且其性别和年级是独立的，那么此课堂有多少个二年级女生？ 

56. 你一直在收集优惠券，假设一共有 m 种优惠券.若每次收集优惠券时，得到第 i 种优惠 
券的概率为 Pi,i = l ,--, m . 假设你正收集第 n 张优惠券，那么它是 张 新类型（以前 
未曾收集到）的概率有多大？ 

提示： 以这张优惠券的种类为条件. 

57. 一个关于股价变化的简化棋 型为： 每一天股价 t 涨一个单位的概率为 p , 下跌一个单位的 

概率为1 不同天里的变化认为是独立的. 

( a ) 2天后股价仍维持在初始水平的概率是多大？ 

( b ) 3天后股价上株1个单位的概率是多大？ 

( c ) 己知三天后股价上涨了一个单位，问第一天股价上涨的条件概率是多大？ 

58. 我们希望模拟掷一枚均匀硬币的试验，但是我们只有一枚不一定均匀的硬币，其正面朝上 
的概率为未知的 p ( p 不一定为 1/2). 考虑下面 步骤： 

(1) 掷一次 硬币； （2) 再掷-次 硬币； 

(3) 如果上面两次结果一样，回到第1 步； （4) 最后-次掷出的结果，作为试验结果. 

( a ) 证明： 这样得到的结果，正面朝上或朝下的概率是一样的. 

( b ) 如果我们简化了步骤.将硬币掷到出现两次不同时为止，将最后-次掷硬币的结果作 
为试验结果.这样做可以吗？ 

59. 独立抛掷一枚硬币，每次正面朝上的概率为 P , 前四次结果如下的概率是多大？ 

( a ) H , H , H , H ； ( b ) T , H , H , H ; 

( c ) 在连续掷硬币过程中， T , H , H , H 出现在 H , H , H , H 之前的概率是多大？ 

提示： 对于 （ c ), 在什么条件下先发生？ 

60. 人眼的颜色由一对基因决定.如果都为盔色基因，那么眼睛为蓝色；如果都为棕色基因，那 
么眼睛为棕色.如果一个是蓝色基因，一个是棕色基因，那么眼睛为棕色.（我们称掠色基 
因比蓝色基因占优势 .） 一个新生儿独立地从其父母处各得到一个遗传基因，父亲的基因 
对中的任-基因以相等的概率遗传给他的孩子.母亲的情况也是—样的.假设史密斯及 
其父母眼睛都为棕色，但其姐姐眼睛为蓝色. 
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( a ) 史密斯拥有蓝色基因的概率多大？假设史密斯先生的夫人眼睛为蓝色. 

( b ) 他们第一个孩子的眼睛为蓝色的概率是多大？ 

( c ) 如果他们第一个孩子的眼睹为棕色，它们第二个孩子眼睹为棕色的概率是多大？ 

61. 有关白化病的基因记为 A 和 a , 只有从其父母都遗传得到了基因 a 的人才会得白化病. 
有基因对 A , a 的人在外表上是正常的,但是因为他能将其基因传给下一代，因此称为携带 
者.现假设有一对正常的夫妇有两个小孩，其中有一个为白化病.假设另一个未得白化病 
的孩子将来与一个白化病携带者结婚. 

( a ) 他们的第一个孩子得白化病的概率是多大？ 

( b ) 已知他们的第…个孩子未得白化病的条件下，第二个孩子得白化病的条件概率是多 
大？ 

62. 芭芭拉和黛安娜出去射击.假设芭芭拉每次射击击中目标（木鸭子）的概率为 Pl , 而黛安 
娜每次射击击中目标的概率为 P 2. 假设她们同时射击同一目标.如果木鸭子翻了（表示射 
中了)，以下事件概率是多大？ 

( a ) 两人都射 中了. ( b ) 芭芭拉射中了. 

其中作了怎样的独立性假设？ 

63. A 和 B 卷入一场决斗.决斗的规 则是： 捡起自己的枪，并同时射击对方.如果有一人或两 
人都被射中，那么决斗结束.如果两人都射空，那么重复过程.假设每次射击结果都是独 
立的，且 A 射中 B 的概率为 p A , B 射中 A 的概率 pb , 计算 

( a ) A 没被击中的 概率； ( b ) A , B 都被击中的 概率； 

( c ) n 局决斗后决斗停止的 概率； （ d ) A 没被击中的条件下， n 局决斗停止的条件 概率； 
( e ) 两人都被击中的条件下， n 局决斗停止的条件概率. 

64. 在一个答题秀节目上，一对夫妇遇到了一道题，丈夫和妻子独立给出正确答案的概率都为 
p . 对于这对夫妇，以下哪个策略更好？ 

( a ) 任选一个人并让其答厘. 

( b ) 他们俩都给出问题的答案，如果答案一致,那么就采用这答案，如果答案不••致，那么 
掷硬币决定采取谁的答案. 

65. 在习题64中，若 p = 0.6, 且夫妇采用 （ b ) 的策略，那么在如下条件下夫妇给出正确答 
案的条件概率是多大？ 

( a ) 夫妇给出的答案一致 • （ b ) 夫妇给出的答案不一致. 

66. 在图 3.4 中所示的电路里，第 i 个继电器闭合的概率为 Pi , t = 1,2,3,4,5.如果所有继电 
器的功能相互独立，试对如下 （ a )、（ b ) 两种情况，分别求出 A 和 B 之间是通路的概率. 
提示： 对于 （ b ), 以继电器3是否闭合为条件. 

67. —个由7!个部件组成的系统称为 “fc - n ” 系统 （fc < n )， 如果此系统运行当且仅当它的 n 
个部件中至少有 fc 个部件运行.假设它的各部件运行是相互独立的 • 

( a ) 如果第 i 个部件运行的概率为内, * = 1,2, 3,4,求一个 “2-4” 系统运行的概率. 

( b ) 试对 “3 -5” 系统求出上述概率； 

( c ) 假设一个 “ k - n ” 系统所有的都等于 p (即 P< = p , i = 1,2 . • • , »»), 试对此系统求 
出上述概率. 
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68.在习题66⑷中，己知 A 和 B 是通路的条件下，求继电器1和2均闭合的概率. 



( b ) 

图 3.4 习题66中的电路示意图 


69. 某种生物具有一对基因组，其中每个基因组由5个不同的基因组成•这5个基因用5个 
英文宇母表示_每个基因有两种特性，分别用大小字母来区别.大写字母表示显性，小写 
字母表示隐性.若某生物具有基因对（ X , X ),此时，该生物表现基因 X 的 特征. 例如 ，X 
代表棕色眼睹， X 代表蓝色眼睛，那么具有 （ X , X ) 或 ( x , X ) 的都是棕色眼睹，而 （ X , x } 时 
为蓝色眼睹.生物的表现特征 （ phenotype ) 与基因特征 ( genotype ) 是有区别的.例如，一 
个生物具有基因特征 aA , bB , cc , dD , ee , 另一个生物具有基因特征 AA ， BB ， cc ， DD ， ee , 它们 
的基因特征不同，但表现特征是相同的.对于每一种基因的基因对，交配双方都随机地贡 
献其中 一个. 例如，对某种基因，父方的基因为 ( Xpc ), 母方的基因为 ( X . X ), 此时,其子女 
接受父方的一个 X ( 或 x ), 母方的一个 X ,构成子女的基因的两个特征.现在设交配双方 
的5种基因组分别为 aA , bB , cC ， dD , eE 和 aa , bB , cc , Dd . ee . 分别计算子女的⑴基因特征 
和 （ ii ) 表现特征与 （ a ) 第一个亲代相同的 槪率； 0>)第二个亲代相同的概率；（<0某一 
个亲代相同的概率； （ d ) 与两个亲代都不相同的概率 • 

(第一个亲代指基因组为 aA , bB , cC , dD , eE 的亲代，第二个亲代指基因组为 aa , 
bB , cc , Dd , ee 的亲代 .） 

70. 女王有50%的可能携带有血友病的基因.如果她是一个携带者，那么每个王子都有50% 
的可能有血友病.如果女王有3个王子,且都没有血 友病. 那么女王是携带者的概率有多 
大？如果有第四个王子，那么他有血友病的概率有多大？ 

71. 在1982年12月30日，美国全国棒球协会西部赛区积分榜排名前三名如下： 
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球 队 

贏 

输 

亚特兰大勇士 

87 

72 

旧金山巨人 

86 

73 

洛杉肌躲闪者 

86 

73 


每个队还剩三场比赛需要打，巨人队的所有三场比赛的对手是躲闪者，而勇士队的所有三 
场比赛的对手是圣迭戈教士队.假设所有比赛结果是独立的，且每场比赛双方获得胜利的 
可能性是一样的.那么各个队取得排名第一的概率是多大？（如果两个队并列第一，还需 
要进行附加赛，以决定名次,此时，假定各队获胜概率为 1/2.) 

72. 市政委员会由7人组成，其中包含一个由3人组成的核心委员会.一个新的法律提案首 
先由核心会员会表决.若核心委员会中有2人以上同意，才能拿到全体委员会上讨论 .一 
旦到了全体委员会，只要有4票以上通过，这个新的法律提案就生效.现在有一新的法 
律提案.设每个委员以概率 p 同意这个提案，并且相互独立地作出投票决定.求一个核心 
委员会成员起决定作用的概率.所谓起决定作用是措若他的决定是相反，其最后结果也相 
反.即若他投赞成栗，法案就通过，他若投反对票，法案就不通过.不在核心委员会的委员 
起决定作用的概率 ft 多少？ 

73. 假设某对夫妇的每个孩子是男是女的可能性一样，且与这个家庭里的其他孩子的性别是 
独立的.对于一个有5个孩子的家庭，计算如下辜件的 概率： 

( a ) 所有的小孩同一 性别； ( b ) 最大的三个为男孩，其他为 女孩； 

( c ) 正好三个 男孩； ( d ) 最大的两个为 女孩； ( e ) 至少有一个女孩. 

74. A 和 B 轮流掷一对殽子，当 A 掷出“和为9” 或 B 掷出“和为6” 时停止,假设 A 先掷， 
求最后一次掷是由 A 完成的概率. 

75. 某村子有一个传统，家庭里的长子和其妻子有义务照顾他们的年迈父母.然而,近年来，这 
个村的妇女不愿意嫁给长子. 

( a ) 如果每个家庭都有两个孩子，问所有的儿子中长子占多大比例？ 

( b ) 如果每个家庭都有三个孩子，问所有的儿子中长子占多大比例？ 

假设出生要儿时，是男孩或女孩的槪率是相同的，并且家庭里各小孩的性别是独立的. 

70. 假设 E , F 为某次试驗的互不相容的亊件. 证明： 如果独立重复进行这样的试验，那么£ 
发生在 F 之前的概率为 P ( E )/[ P ( E ) + P { F )]. 

77. 考虑-•个无穷的独立重复试验序列，每次试验都等可能地以1, 2, 3为结果.假设3次试 
验后最后一次试验结果为3,求以下条件 概率： 

( a ) 第一 次试轮结果为1; ( b ) 前两次试验结果都为 1. 

78. A 和 B 进行一系列比赛，每局比赛 A 获胜的概率都为 p , B 获胜的概率为1 _ P , 且每次 
比赛结果相互独立.当其中一人比另一人多胜两局时，游戏停止，获胜局数多的选手获得 
比赛胜利_ 

( a ) 求总共比赛了 4局的概率 .（ b ) 求 A 最后获得比赛胜利的概率 • 

79. 连续地掷一对均匀骰子，在出现6次“和为偶数”之前，出现2次“和为7” 的概率是多 
大？ 
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80. 选手们水平相当，在每次比赛中任一方获胜的可能性都是1/2.共有 2" 个选手随机地一 
一 K 对比赛，随后的2"— 1 个胜者再随机地一一配对比赛，如此这般，直到最后一个获胜 
者出现.对指定的 A , B 两人，定义亊件< n 和£ 如下： 

A : A 参与了 i 场比赛 E : A , B 从未比赛过 


⑷求 P ( Ai ), t = 1, ••- , n ; 
( c ) 令 P n = P (£), 证明 


( b ) 求 P(E). 

Pn = ( 全 ) 2p " -1 


并利用此竣证 （ b ) 里得到的答案. 

提示： 以亊件 A *,* = !,••• , n 发生为条件，计算 P(E), 再利用以下代数恒等式 




― 1 + ( n - 1)*" 

71^5 


来化简答案.另外一个解决此问题的方法是，注意到一共进行了 2 n - 1场比赛. 

⑷解释为什么总共有2” - 1场比赛. 

给这些比赛进行编号，且令氏表示和 S 在第 i 场比赛中碰面”， i = l ，"’ ,2 n - l . 
( e ) P(Bi) 是多少？ （ f ) 利用 （ e ) 计算 P(E). 

81. 某股票投资者有一只股票，其现价为 25. 她决定当股价跌至10或涨至40时卖出股栗. 
如果股价的每次变化都是以 0.55 的概率上 * 1点，以0_45的概率下跌1点，且每次变动 
(上涨或下跌）是相互独立的，那么投资者最后获利的可能性是多大？ 

82. A 和 B 掷硬币， A 先开始并连续掷硬币，直到出现反面朝上.此时， B 开始掷硬币直到出 
现反面朝上,然后又轮到 A 掷,等等.令 Pi , ft 分别表示 A 和 B 掷硬币时正面朝上的概 
率.若谁先达到如下获胜条件則胜，求 A 获胜的概率. 

( a ) 在一轮中有两个正面朝上； （ b ) 双方总共2个正面 朝上； 

( c ) —轮中3个正面 朝上； （ d ) 双方总共3个正面朝上. 

83. 骰子 A 有4面红2面白，而骰子 B 有2面红4面白.先掷一枚均匀的硬币，如果正面朝 
上，那么用骰子 A 玩游戏，如果是反面朝上，那么用骰子 B . (在整个游戏过程中，只在开 
始时掷一次硬币 .） 

( a ) 证明每次掷出红色一面的概率为1/2; 

( b ) 若前两次投掷结果都为红色一面，那么第三次投掷也为红色的概率是多大？ 

( c ) 如果头两次投掷都为红色，那么使用的 是殽子 A 的概率是多大？ 

84. 坛子里有12个球，其中4个白球,三个选手 A . B . C 依次从坛中取球， A 最先，然后 B ， 然 
后 C , 再是 A , 依次进行下去•第一个取出白球的人获胜.求每个选手获胜的概率，如果 
( a ) 毎个球取出后再放回； 0>)取出的球不放回. 

85. 当3个选手各自选择自己的坛子时，重做习题84,也即，假设有3个不同的坛子，每个里 
面有12个球,其中4个白球 • 

86. 令 S = {1,2, • •- , n }, 假设>1和 B 独立，等可能地为 2" 个子集之一（包括空集和5本 

身)- 
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⑷ 证明： 

P { ACB}=(|) n 

提 示：令 N ( B ) 表示 B 里元素个数，利用 

P{A CB } = ^2 P{AC B \ N ( B ) = i } P { N ( B ) = i } 

i=0 

( b ) 证明 P{AB = 0}= (|) n . 

8 T . 在例 5 e 里，已知前 n 次结果都是正面朝上的条件下，求选中第 i 个硬币的条件概率. 

88. 拉普拉斯继承规则里（例 5 e ), 各次投掷结果是否独立？试解释之. 

89. 由3名法官组成一陪审团.某人被审讯后，若至少两名法官投“有罪”票，则判决此人有 
罪.假设对一名事实上有罪的被告，每个法官独立地投“有罪”票的概率为 0.7, 而对事实 
上无罪的被告，这个概率下降到 0.2. 如果70%的被告亊实上是有罪的，试对如下各条件 
求出3号法官投“有罪”票的条件概率. 

(a) 1 号法官和 2 号法官都投“有罪 ”果； 

( b ) 在1号和2号法官所投的栗中，一张“有罪”，另一张“无 罪”； 

(c) 1 号和 2 号法官全投“无罪”栗. 

以岛,< =1,2,3表示 i 号法官投一张“有罪”票的亊件，这些亊件是否相互独立？是否条 
件独立？试说明理由. 

90. 假设进行 r » 次独立重复试验,毎次结果是0,1或2的概率分别是 po, Pl 和 pa , E ?= 0 P * = 1 - 
求结果1和2都至少出现一次的概率是多大？ 


理论习题 


1. 若 P ( A ) > 0,证明 

P ( AB \ A ) > P ( AB\A U B ) 

2. 若 C S , 尽可能化简如下 概率： 

P ( A \ B ) P ( yl | B c ) P ( B \ A ) P ( B | A C ) 

3. 考虑有 m 个家庭的社区，其中有 m 个家庭有 i 个孩子 i = 1, ■ ■ • , fc , Ei =, m 考虑 
如下两种选择孩子 方式： 

( a ) 随机选择一个家庭，然后再随机选择一个 孩子； 

( b ) 从个孩子中随机挑选-个_ 

证明： 第一种方法挑选出来的孩子是他家里第一个出生的孩子的概率大于第二种方法挑 
选出来的. 

提示： 为了解此题，需要证明 

<=1 j=i j <=i >=1 

为了证明这点，将两边展开，证明对于任意一组 (*, i ), 式子左边的项 runj 的系数比右边 
的大. 
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4. 已知有 - 个球放在 n 个盒子中的一 个内. 己知球在第 i 个盒子的概率是只.如果球在第 
i 个盒子里，搜寻该盒子时还可以找不到这顆球.假定球在盒子 i 内的条件下，搜寻时能 
找到球的概率为你. 证明： 己知搜索第 i 个盒子没有发现球的条件下，球在第 j 个盒子 
的条件概率是 

T^P ： 若 # 

i- ai Pi 句 - * 

5. 事件 F 称作不利于亊件£的，并记为 F \ £；，若 

P(E\F) < P(_E) 


试证明如下论断或者给出 反例： 

( a ) 若 F \ £，则 E \ F -, 

( b ) 若 F \ E , 且丑 \ G ，则 F \ G ; 

( c ) 若 F \ 且 G \ 五 ，则 FG \ 

同样还可定义 F 有利于并记作 F / £：，若 P (£| F ) ^ P ( E ). 将\改为/重做 
( a )( b )( c ). 

6 . 证明： 若 EuEh , …， E n 为相互独立亊件列，则 


P(Ei U £» U • • • U £：„) = 1 - J|[l - P (£ i )] 

7. ( a ) 坛子里有 n 个白球和 m 个黑球，每次随机从中取出一个，直到剩下的球为同一种颜 

色.证明剩下的球全为白球的概率为 n/(n + m ); 

提示： 设想试验•直进行直到所有球都取走，并考虑最后取出的球的颜色. 

( b ) 池塘里有3种不同的鱼，我们分别称为红、 K . 绿鱼.三种鱼分别有》•、6、 g 条.假设 
按-•随机顺序将这些鱼全部移走（即每次选择对于剩下的鱼都是等可能的)，问巔先 
抓完红鱼的概率？ 

提示： 将蓝、绿的鱼视为同一种鱼，称为非红鱼.再利用（岣中采用的方法解题. 

8. 设一次掷两枚对称的骰子， A , B,C 为与试 Ife 有关的三个事件. 

⑷若 

且 PiAlC 0 ) > P ( B \ CT ) 

或者证明 P { A )> P ( B ), 或者定义事件 A , B,C 说明不等式 P ( A )> P ( B ) 不成立. 
( b ) 若 

PMIOsPMIC 1 ) 且 P ( B \ C ) > PCBICT 0 ) 

或者证明 P ( AB \ C ) > P ( AB \ Cr ), 或者构造事件 A , B,C 说明不等式 P ( AB \ C ) : 
P ( AB \ C °) 不成立 • 

提示： 令 （7 表示“掷一对18子，点数之和为10”，令>1表示“第一个敗子点数为6”，令 
B 表示“第二个敗子点数为6” . 
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9. 考虑独立地梅两次均匀硬币.令>1表示第一次为正面朝上，令 B 表示第二次为正面朝上， 
令 C 表示两次朝向一样.证明事件 A , B , C 为两两独立.也即，>1和 S 独立，4和 C 7 独 
立，丑和 C 独立，但 A , B , C 不独立. 

10. 考虑有 n 个人，俚定每人的生日在365天内任一天的可能性都是一样的，且相互独立.令 
Aj 表示“第 i 个人和第; j 个人”生日相同， i ^ j , 证明： 这些事件都是两两独立的，也 
即 Ay 和 A r ,« 是独立的，但是这个亊件并不独立. 

11. 设有一枚硬币，在掷硬币时正面朝上的概率为 P . 现独立掷 r » 次.问 n 需多大，才能保证 
至少有一次正面朝上的概率大于1/2? 

12. 若 0 彡04<1，* = 1，2，...，证明 

f ； Ln ( l - a i )|+ n ( l - a < ) = l 

‘=i L }=i J <>i 

提示： 假设掷无限多个硬币，令表示第 i 个硬币正面朝上的概率，考虑出现第一个正 
面朝上的时刻. 

13. 设有一枚硬币，在抛掷时正面朝上的概率为 P . 假设 A 开始连续掷硬币，直至出现了反面 
朝上,此时 B 接着连续掷硬币，直到掷出反面朝上为止,然后 A 再接着掷,如此进行下去. 
令 Pn . m 表示在 B * 计 m 次正面朝上之前 A 已累计 n 次正面朝上的概率. 证明： 

Pn,m = pPn - l,m + (1 — p)(l — Pm , n ) 

*14. 假设你同一个无限富裕的人赌博，每-步你可能贏也有可能输1个单位,概率分别为 P 和 
1- P . 证明你最后输光的槪率为 

J 1 若 p < 1/2 

{(q/pY 若 P>"2 

其中9 = 1 - p 且 i 是你的最初资金. 

15. 独立重复进行每次成功率为 P 的试验，直到总共有 r 次成功 为止. 证明恰好需要进行 r * 
次试验的概率为 

C :; K ( n r 

并利用此结果解决赌本分割问题(例 4). 

提示： 为了在 n 次试验中得到 r 次成功，在前 n - 1次试验中必须有多少次成功？ 

16. 若某独立重复实验序列中，每次试验结果只有两种，成功或失败，则这种试验序列称为伯 
努利试验序列.现设一个《次独立重复的伯努利试验序列，毎次试验成功的概率为 P (失 
畋的概率为1 - p ). 记只 •表示 n 试验中出现偶数次 （0 认为是偶数）成功的概率，证明 

P „ — p(l — P n - l ) + (1 — p ) Pn-l n 彡 1 
并利用此公式（利用归纳法）证明 


1 + (1- 2 P )" 
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17 . 考虑进行 n 次独立试验，第 i 次试验成功的概率为 l /(2 i + l ). 令/>„表示总的成功次数 
为奇数的概率. 

( a ) 计算 P „， r » = l ，2,3,4,5 ; 

( b ) 猜测 的一 个一般 公式； 

( c ) 导出用 P „_ i 表示的 P „ 的递推 公式； 

( d ) 验证 （ b ) 中的猜测满足 （ c ) 中的递推公式.因为递推公式只有一个解，这就证明了你 
的猜测是正确的. 

18. 令 Q „ 表示连续掷 n 次均匀硬币，没有出现3个连续的正面朝上的概率.证明 

Qn = ^ Qn-1 + i <? n-a + ^ Qn -3 
Qo = Qi = Qa = 1 

并求 q 8 . 

提示： 以出现第一次反面朝上的时刻为条件. 

19. 考虑赌徒输光问题，不同的是 A 和 B 同意最多玩 n 局.令 PtM 表示 A 最后输光所有钱 
的概率，其中开始时 A 有 i 元而 B 有 ；V - i 元. 推导用和 Pn - i . 4 - i 表示的 
Pn , i 的公式，并计算 Pr . 3 , N = b . 

20 . 假设有两个坛子，每个坛子中既有白球，也有黑球.从两个坛子里取出白球的概率分别为 
p 和 P '. 按照如下方式连续有放回地取球.最初分别以《的概率从第一个坛子里取球，以 
1 - o 的概率从第二个坛子里取球.接下来的取球按如下规则 进行： -旦取出的是白球， 
则放回，然后从同一个坛子里再取球；如取出的是黑球，那么接下来从另一个坛子里取球 • 
令表示第 n 次从第一个坛子里取球的概率，证明 

a n +i = a n (p + P * - 1) + 1 - P * 1 

并用此证明 ， ,, 

a " = 2~- _ p-7 + G - 2-p-'p) (，，+ P， _ 1 广 * 

令八表示第 n 次取出的球是白球的槪率，求只 •. 并且计算和 ^ Pn - 

21. 投票问题.在一次选举中，候选人 A 获得了 n 张选栗，而 B 获得了 m 张选票，其中 
n > m . 假定所有的 (n + m )!/( n ! m !) 种选栗的顒序都是等可能的，令 Pn . m 表示在统 
计选栗时 A —直领先的概率. 

( a ) 计算 Pa . i , ft . i , ft . a , Pt . i , P *, 2 , P *, 3 - 

( b ) ^ Pn . l , Pn . 2 . 

( C ) 基于⑷和⑼的结果，猜测 Pn . m 的值. 

( d ) 以谁获得了最后一张选票为条件，求用 Pn - l . m 和 Pn . m -1 表示的 Pn . m 的递推公式 • 

( e ) 利用 （ d ), 对 n + m 用归纳法证明 （ c ) 中的猜测. 

22. 作为天气预报的一个简单模型，假设明天天气（湿润或者干燥）与今天相同的概率为 P •如 
果1月1日天气为千燥，证明， n 天后的天气为千燥的概率 Pn , 满足 

P „ = (2 p — l ) P n -i + (1 — p ) n > 1 
Po = l 
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并证明： 

Pn = 5 + 5 (2p_1) " 00 

23. 设一个包里有 a 个白球, 6个黑球，根据以下方式从包里取球. 

第1步随机取出一个球，然后 扔掉； 

第2步再随机取出一个球，若取出的球的颜色与前一次取出的不同，将球放回包内，转 
向第1步.否则，将球扔掉，重复第2步. 

也就是说，随机取球并扔掉，直至颜色发生了变化，此时将取到的球放回包里重新开始.令 
Pa , 6表示包里最后一个球为白球的概率， 证明： 

P ^.b = I 

提示 ： W k = a + b 用归纳法. 

*24. n 个选手的单循环赛，对选手只比赛一次，任何一场比赛的结果都分出输贏.对于一 
个给定的整数 k , k < n , —个有越的问 题是： 是否可能存在一种比赛结果，对于任意 fc 个 
选手的集合，都有一位选手，他打败了该集合内的所有选手.证 明：若 

则这种结果是存在的. 

提示： 假设比赛结果是相互独立的，且每场比赛谁获胜的可能性也是一样的.给 fc 个选手 
的所有个组合标号 ，令氏 表示“在第 i 个组合里，没有人打败所有 fc 个选手 "，然 

后利用布尔不等式求出 P ( UBi ) 的界. 

25. 直接证明 

P (_ E \ F ) = P ( E | FG ) P ( G | F ) + P ^ F ^ P ^ F ) 

26. 证明 （5.11) 和 (5.12) 的等价性. 

27. 将条件独立性的定义推广到2个以上的亊件的情形. 

28. 证明或给出 反例： 如果£:和 Ej 是独立的，那么给定 F 的条件下，它们也条件独立. 

29. 在拉普拉斯继承准则（例 5 e ) 中， 证明： 己知前 n 次掷的结果都是正面朝上的条件下，接 
下来 m 次掷的结果也是正面朝上的条件概率为 （n + l)/(n + m + l ). 

30. 在拉普拉斯继承准则中，假设前 n 次投掷中，有 r 次正面朝上， n - r 次反面朝上. 证明： 
第 n + 1次投掷正面朝上的条件概率为 (r + l)/(n + 2). 此题目证明必需先证明恒等式 

提示： 为了证明该恒等式，令通过分部积分 可得： 

C { n , m ) = + 1, m — 1) 

从 C ( n ,0) = l /( n + l ) 开始，对 》 n 利用归纳法证明恒等式. 

31. 假定你的一个不懂数学但有哲学头脑的朋友声称拉普拉斯继承准则必定是错误的，理由 
是它可以导出荒谬的结论.“例如，”他说，“如果一个孩子10岁，按照这个原则，由于他 
己经活了 10年，那么再活一年的概率为 11/12. 另一方面，如果孩子有位80岁的祖父, 
那么由拉普拉斯准则，祖父再活一年的概率为 81/82. 显然这是荒谬的，因为孩子比祖父 
更容易再活一年.”你怎么回答这位朋友？ 



自检习題 105 


自检习题 

1. 在一局桥牌中，西家没有 “ A ”， 求以下事件的 概率： 

( a ) 他的搭档没有 “ A ” ； ( b ) 他的搭档有 2 个或更多的 “ A ” ？ 

( c ) 如果西家正好有一个 “ A ”， 以上概率又各是多少？ 

2. 一个新的汽车电池使用超过10 000英里的概率为 0.8, 超过20 000英里的概率为 0.4, 超 
过30 000英里的概率为 0.1. 如果一个新的电池在使用10 000英里以后仍能继续使用， 
求以下概率： 

( a ) 其总寿命超过20 _英里； （ b ) 它还能继续使用20 000英里. 

3. 怎样将10个白球10个黑球共20个球放入两个坛子内，使得随机选择一个坛子并随机 
从中取出一个球是白球的概率最大？ 

4. 坛子 A 有2个白球1个黑球，而坛子 B 有1个白球5个黑球.随机从坛子 A 中取一个 
球放入坛子 B ， 然后再随机从坛子 B 内取出一球.己知取出的是白球，问从坛子 A 中取 
出的放入坛子 B 的球是白球的概率是多大？ 

5. 坛子里有 r 个红球和 u ; 个白球,每次随机取走一个.令 ft 表示“第 i 次取走的是红球”， 

计算 

⑷ P(ft )； ( b ) PiR ^ lRs )； (c) P(ft3|fls). 

6. 坛子里有 & 个黑球， r 个 红球. 随机取出一个，再放回，同时还放入 c 个同样颜色的 
球.现在，再取一个球，证明已知第二个球是红球的条件下，第一个球是黑球的概率为 
6/(6 + r + c ). 

7. 你的一个朋友从一副52张牌里无放回地随机取出2张牌.在下列情形下，计算两张都是 
“ A ” 的条件 概率： 

( a ) 你问是否其中一张是黒桃 “ A ”， 你朋友的回答是肯 定的； 

( b ) 你问是否第一张是 “ A ”， 你朋友的回答是肯 定的； 

( c ) 你问是否第二张是 “ A ”， 你朋友的回答是肯 定的； 

( d ) 你问是否其中有一张是 “ A ”， 你朋友的回答是肯定的. 

8 . 证明： P{H\E) P(H) P(E\H) 

P{G\E) = P(G) P(E\G) 

考虑： 在得到新的证据前，假设好成立的可能性是假设 G 成立的可能性的3倍.如果 G 
成立时新的证据出现的可能性是 H 成立时的两倍，那么当新证据出现时，哪个假设更有 
可能成立？ 

9. 你外出度假时，请邻居给你的病树浇水.如果没浇水的话，它死去的概率为 0.8. 如果浇水 
的话，它死去的概率为 0.15. 你有90%的把握确定邻居记得浇水. 

( a ) 当你回来时，树还活着的槪率是多大？ 

( b ) 如果树死了，那么邻居忘记浇水的概率是多大？ 

10. 一个坛子装有8个红球、10个绿球和12个蓝球，从中随机地取出6个球 • 

( a ) 其中至少有一个红球的槪率有多大？ 

( b ) 己知其中没有红球的条件下，在6个球中恰有2个绿球的概率有多大？ 
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11. 市场上电池有两种牌子.牌子 C 的电池为合格品的概率为 0.7, 而牌子 D 的电池为合格 
品的概率为 0.4. 在一盒子中有8个牌子为 C 的电池和6个牌子为 D 的电池.现从这盒 
子中随机地选出一个电池. 

( a ) 这个电池为合格品的概率有多大？ 

( b ) 己知这个电池为不合格品，那么它是牌子为 C 的概率有多大？ 

12. 玛丽亚在一次旅行中带两本书.假定她喜欢第一本书的概率为 0.6, 喜欢第二本书的概率 
为 0.5, 两本书都喜欢的槪率为 0.4. 求在她不喜欢第一本书的条件下審欢第二本书的条 

件概率. 

13. 一个坛子装有20个红球和10个蓝球,现从坛子中一个一个地取出球. 

( a ) 求“全部红球被 取出” 早于“全部篮球被取出”的概率. 

现在假定坛子装有20个红球、10个蓝球和8个绿球. 

( b ) 现在再计算“全部红球被取出”早于“全部藍球被取出”的概率. 

( c ) 金子中的球的颜色消除的顺序为 K 、 红、绿的概率有多大？ 

( d ) 计算蓝球是三中颜色球中最早被全部取出的概率. 

14. 己知一个硬币抛掷时其正面出现的概率为 0.8. A 在抛掷一次以后，很匆忙地跑到他的同 
寧 B 处，告诉 B 他所看到的结果.然而，当 A 跑到同亊 B 处时，他以 0.4 的概率忘掉了 
他抛掷硬币的结果.于是，他就随机地挑选一个结果（正面或反面）告诉 B . 然而，他若不 
忘记的话，他会将所抛掷的结果告诉 B . 

( a ) B 被告之硬币正面向上的概率有多大？ 

( b ) B 被告之正确结果的概率有多大？ 

( C ) 己知 B 被告之硬币正面向上的条件下，硬币的确是正面向上的概率有多大？ 

15. 某种老》，黑色比掠色占优势（熏色对应显性基因，棕色对应隐性基因).假设某只厢老鼠 
有个兄弟是棕色的，但其父母都是黑色的. 

( a ) 该老鼠是纯黑色的概率是多大？（相对它的基因对是一个黑色,_ - 个棕色的混合而言 .） 

( b ) 假设当这只老鼠和一只棕色老鼠交配时，其所有5个后代都是黑色的，此时，这只老 
鼠为纯黑老鼠的概率是多大？ 

16. ( a ) 在习题 66 b 里，以开关1是否关为条件，计算电流能从 A 到 B 的概率. 

( b ) 己知电流能从 A 到 B 的条件下，开关3是合上的条件概率. 

17. 在习题67中描述的 fc - n 系统，假定每个元件相互独立且正常工作的概率为1/2,求已 
知系统正常工作的条件下，元件1工作正常的条件概率，当 

( a ) k = l,n = 2. ( b ) fc = 2 ,n = 3. 

18. 琼斯先生为了贏得幸运轮中奖，设计了一套如下的赌博 策略： 当他押注时，只有当前面10 
次都出现黑色数字时才押注在红色数 字上. 他的理由是连续11次出现黑色的概率非常 
小.你认为他的策略如何？ 

19. A , B , C 三人同时掷.-枚硬币，掷出正面朝上的概率分别为 PuPi , P 3 , 如果有一个人掷出 
的结果与其他两人不一样，那么就称他为奇异人.如果没有出现奇异人，则继续掷硬币，直 
到出现奇异人，那么 A 被称为奇异人的槪率是多大？ 

20. 假设某次试验有 n 个结果，结果 i 出现的槪率为 Pi) t = l , •••,«, Er = iP < = l 如果观察 
两次试验，那么第二次的试验结果大于第一次结果的概率为多大？ 



21. 如果 A 掷 n + 1 枚， B 掷 n 枚均匀硬币， 证明： A 得到的正面朝上数大于 B 得到的正面 
朝上数的概率为 1/2. 

提示： 以毎人掷出 n 枚硬币后，谁具有更多的正面朝上数为条件（共有三种可能) • 

22. 对于下列叙述，试证明或给出 反例： 

( a ) 若 E 独立于且 E 独立于 G , 则£独立于 FUG ; 

( b ) 若£独立于 F , E 独立于 G , 及 FG = 0，则 E 独立于 FUG ; 

( c ) 若£独立于 F , F 独立于 G , 及 E 独立于 FG , 则 G 独立于 £ F _ 

23•令 A 和 S 为具有正概率的事件，说明以下叙 述是⑴ 必然对；⑻必然错；（出）可能对_ 

( a ) 若>1和 B 互不相容，则它们独立； 

( b ) 若>1和 S 独立，则它们互不相容； 

( c ) P ( A ) = P ( B ) = 0.6, 且 互不相容； 

( d ) P ( A ) = P { B ) = 0.6, 且 A，B 互相独立. 

24. 按照发生的概率的大小，将下列亊件排序： 

(a) 掷一枚均匀硬币，正面朗上； 

( b ) 3次独立重复试验，每次成功的概率均为0.8,三次都 成功； 

( c ) 7次独立重复试轮，每次成功的概率均为 0.9, 7次都成功. 

25. 有两个工厂生产收音机，工厂 A 生产的每台收音机是不合格品的概率为0.05,而工厂 B 
生产的每台收音机为不合格品的概率为 0 . 01 .俚设你在同一家工厂购买了两台收音机，且 
这两台收音机来自 A 厂或 B 厂的概率是相等的.如果第一台收音机检测后发现是不合 
格品，求另一台也是不合格品的条件概率 • 

26. 证 明：若 P ( A | B ) = 1,则 P ( B ^\ A K ) = 1. A 

27. 坛子里开始有-个红球, 一个® 球.每步从其中随机地取出一个并同时放入两个同颜色的 
球.（比如，若开始取出了红球，那么在下次取球时，坛子里有2个红球1个蓝球 .） 利用 
数学归纳法 证明： n 步后，坛子里正好有 i 个红球的概率为 l/(n + l ), l < i < n + l . 

28共有 2 r » 张牌，其中2张为 “ A ” . 将这些牌随机分给两位选手，每人 n 张.然后两位选手 
按领牌次序声明自己是否有 “ A ”. 在第一人声称自己有 “ A ” 时，第二人没有 “ A ” 的条件 
概率是多大？其中 


( a ) n = 2; ( b ) n = 10; ( c ) n = 100. 

当 n 趋于无穷大时，该概率的极限值是多大？为什么？ 

. 市场上一共有 n 种不同的优 惠券. 某人收集优惠券，每次收集-张，并且各次收集是相互 
独立的.己知每次收集到第 i 种优惠券的概率为 Pi <' Ei= l Pi = 1 - 

( b ) 现在假设 pi = pa = … =Pn = 1 /n •令拉表不“在收集到的 n 张优惠券里没有第 
i 种优惠券”，对 P ( U <®0 利用容斥等式证明恒等式 


k=0 

30. 对任意事件 E 和证明 

P (£| EUF )> f »(£：| f ) 


提 示：以 F 是否发生为条件求 P ( E \ EUF ). 



第 4 章随机变量 

4.1 随机变量 

进行试验时，相对于试验的实际结果而言，通常我们更感兴趣有关试验结果的 
某些 函数. 比如，在掷两枚敢子的游戏中，我们通常更关心两枚殺子的点数之和，而 
不是各枚骰子的具体值.也即，我们或许关心骰子点数之和为7,而不关心实际结果 
究竞是 （1,6) 或（2,5)，或 （3,4), 或(4,3)，或(5,2)，或 (6,1). 同样,在掷若干枚硬币时， 
我们或许关心正面朝上的总数，而不关心实际结果有关正面朝上或反面朝上的排列 
情况.由上面的例子可以看出，这些感兴趣的量是试验结果的实值函数，我们称之 
为随 机变量 (random variable ). 随机 变量是定义在样本空间上试验结果的实值函数. 

因为随机变量的取值由试验结果决定，因此我们也将随机变量的可能取值陚予 
概率. 

例 ia 考虑掷3枚均匀硬币的试验.令 y 表示正面朝上出现的枚数，那么 y 
就是一个随机变量，它的取值为0，1，2,3之 一 ，各自概率为 

P{y = 0} = P{(T,T,T)} = i 

P{Y = 1} = P{(T,T,H),(T,H,T) ) (H,T,T)} = I 

P{Y = 2} = P{(T, H, H), (H, T, H), (H, H,T)} = | 

P{y = 3} = P{(H,H,H)} = i 

此处 H 表示正面朝上, T 表示正面朝下.因为 V 的取值必是0到3之 一 ，故有 

l = P (( j{Y = i }) = j 2 P i Y = i y 

t=0 i=0 

关于随机变量取值的概率，其性质与前文介绍的关于事件的概率是一致的. ■ 

例 lb —个坛子里装着标有数字1到20的20个球,无放回地从中随机取出 
3个，如果打赌取出的球中至少有--个号码大于等于17,打賭获胜的概率是多大？ 
解••令 X 表示取出的球中最大的号码,那么 X 就是取值为3,4,…，20之一的 
随机变量.而且，如果我们假定种抽取方式中任一种方式都是等可能的，那 
么 
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P{X =*} = 


(^) 


( 1 _ 1 ) 


(1.1) 式是这样得 到的： 事件 {X = i } 意味着从20个球中抽取一个号码为 i 的球， 
再从号码为1到 i - 1中抽取2个球，显然一共有 (D C ”种抽取方式.这样就 
可以得到式 (1.1). 由上式可以得到 


P{X = 20} = 


P[X = 18} = 


( l !) 

3 

© 

51 

W) 

= 20 = 0150 

P{X = 19}= - = 

( 2 3°) 

380 


34 

Q 

2 


= 285 « 0119 

P{X = 17}= —— = 
(?) 

= 19 


由于事件{ X 多 17} 就是不相交事件 {X = *},!= 17,18,19,20的并.这样，能够贏 
得打赌的概率就是 


P{X ^ 17} « 0.105 + 0.119 + 0.134 + 0.150 = 0.508. ■ 

例 lc 设有一枚不均匀的硬币，每次掷硬币时，正面朝上的概率为 p . 现在独 
立重复地掷硬币，直到出现正面朝上或者已经掷了 n 次为止.令 X 表示投掷硬币 
的次数,那么 A ■就是一个取值为 l ,2,3..., n 之一的随机变量， A " 的取值概率为 
P{X = 1} = P { H } = p 
P{X = 2} = P {( T , H )} = ( l - p)p 
P{X = 3} = P {( T , T , H )} = (1 - P ) 2 P 


P{X = n - l } = P {( T , T ,--, T , H )} = ( l - p) n ~ 2 p 


P{X = n } = F {( T , T , ••- , T , T ), ( T , T ,--- , T , H )} = (1 - p )"' 1 

n —1 n—1 

作为验证，注意到 

p(y{A-=*}) = ^p{A- = i> = 2p(i-pr i +(i - p)"- 1 
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= p[ 1 ~l 1 ~^p~ 1 ] + (1 - P) n_1 = 1 - (1 - p )"- 1 + (1 - P) n - 1 = 1 ■ 

例 Id 某个坛子里有 3 个白球、 3 个红球和5个 黑球. 现从中随机无放回地 
抽取3个球.假设进行打赌，抽出每个白球可以贏得1元，每个红球则输掉1元 • 
令 X 表示贏得的总钱数, 那么久 就是一个取值为0,±1,±2,±3之一的随机变量， 
各取值概率为 




(V) 


P{X = 1} = P{X = -1} = 


®M)(D 


© 

^ = 3 } = ^ = - 3 }.^ = ^ 


39 

165 


这些概率是怎样算出来的呢？以 P{X = 0} 的计算为例，由于三个球是随机地抽 


取，因此这种球的组合都是等可能的；而 {X = 0} 可以分解为两种情况，一 
种是抽出来的球全为黑球，这种抽取方法共有种，另一种情况是红、白、黑各 

抽出一个球，这种抽取方式有 ® © © 种，这样，我们就得到= 0} 的计算 
公式.对于 P{X = t } 的其他几个公式，论证是类 似的. 下面的公式验证了我们的计 
算 结果： 


X ； P{X = i} + SP{A- = -t} 
»=o »=i 


55 + 39 + 15 + 1 + 39 + 15 + 1 
165 


因此，我们贏钱的概率为 




例 le 设想有 W 种不同的优惠券，某人收集优惠券，每次收集一张，且每种优 
惠券都以相同的可能性被收 集到. 又假定各次收集是相互独 立的. 假设某人想收集一 
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套 N 种优惠券，他的办法是一张一张地收集，直到收集成一套为止（此时 7 V 种优惠 
券每种至少一张).他所收集到的优惠券的总张数是一个随机变量，记为 T . 与其直接 
计算 P(T = n ), 不如先考虑 r 大于 n 的概率.为此,先固定 n , 并且定义事件 山， 

…，^ 如下： 木表示“前 n 张优惠券里没有第 j 种优惠券” (i = 1，…， A 0. 因此 

P{T > n } = P ( IJ >1,) = ^ P ( Aj ) - X ； 乙尸⑷〜+ … 
i=x i i\<n 

+(-i)* +1 E - ' 

+ ^1)N+i P{A iA2 ... An) 


由于每张优惠券不属于 第：? 种的概率为 ( N - D / N , 利用各次收集相互独立的假设 


可得 


P(4) = (^)" 


而当前 n 张优惠券里，既没有第力种优惠券,也没有第为种优惠券时, A u A h 发生, 
因此= (^) n 用类似的推理，可得 P { A jl A ja - - A jk )= (^)", 
这样，对于 n > 0,我们有 




r 等于 n 的概率可结合下式得到 

P{T > n - 1} = P{T = n } + P{T > n } 

或等价地， 

P{T = n } = P{T > n - 1} - P{T > n } 

另外一个值得感兴趣的随机变量是前 TZ 张优惠券里，优惠券的不同种类数，不 
妨记为 D „. 为了计算 P { D n = fc }, 我们首先把注意力放在一组特定的 fc 种优惠券， 
然后计算我们收集的前 n 张优惠券是由这特定的 A ： 种优惠券组成的概率.而这个 
事件说明所收集到的前 n 张优惠券应当满足 

yl : 每张都是这 fc 种优惠券之一 

B : 这 fc 种优惠券的任一种都在 ri 张优惠券中出现 

这样,我们得到 

户{收集到的 n 张优惠券由特定的 A ; 种优惠券组成 } = P ( AB ) = P ( A ) P ( B \ A ). 
由于收集的每张优惠券属于这*:种之一的概率为 k / N , 因此事件>1的概率为 
( k / N ) n . 而且，在给定每张优惠券是所考虑的种之一的条件下，很容易看出在 
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收集优惠券时， fc 种优惠券中的任一种都是等可能地被收集.因此，给定 A 发生 
的条件下 S 恰好是事件“收全一套 fc 种优惠券，所需收集张数小于等于 n” ，其 
概率正好是本例前面讨论的 {r < 的概率，不过优惠券的总数是 fc 而不是原来 
的 N . 利用（1_ 2 )式，将公式中的 AT 换成 fc, 我们得到 P ( A ) = = 

1 -O (J)(^) n (-l) i+1 - 最后，由于 fc 个种类的集合一共有 (f) 种，因此 

咖- fc > - = ⑽) - 卜 - § (?) ■ 

注释由于至少要收集到 W 张优惠券才有可能得到一整套,因此,如果 n < AT, 
则 P{T > n} = 1. 因此，由公式 (1.2) 我们可得到一个非常有意义的组合恒 等式： 
对于1 < n <尺，有 

g ⑺ (W(-i)〜 

也可写成 

或者，两边同时乘以 （-1 广 AT , 并令= N - i， 得 

Y , ( Ar )j' n (-l) i-1 =0 l ^ n<N ■ 

j=i 3 

对于随机变量 X, 如下定义的函数 F 

F ( x ) = P{X ^ z} - c» < ® < oo 

称为 X 的累积分布函数 (cumulative distribution function), 简称为分布函數.因此， 
对任一给定实数; E, 分布函数等于该随机变量小于等于X的概率. 

假设 a < 6,由于事件{X < a} 包含于事件{X彡 &}, 可知前者的概率 F ⑷要 
小于等于后者的概率 F(6). 换句话说， F(;t) 是; r 的非降函数.第 4.10 节给出了分 
布函数的更一般的性质. 

4.2 离散型随机变量 

若一个随机变量最多有可数多个可能取值，则称这个随机变童为离散 型的对 
于一个离散型随机变量X,我们定义X的概牟分布列(简称为分布列， probability 
mass function) p(a) 如下： 
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戶⑷= P{X = 0 } 

分布列 p ( a ) 在最多在可数个 a 上取正值，也即，如果 X 的可能值为 x u x 2 ，…，那 
么 

p (! i ) > 0 * = 1,2, • •• 

P ( x ) =0 所有其他 i 

由于 X 必定取值于 { x lt x 3 , ■■■}, 这样有 

p ( x ) 

5^p(xi) = 1 

t=i 

用较直观的图形方式，将 p ( Xi ) 标在 1 /轴上，将& 

标在: C 轴上.例如，设 X 的分布 列为： 

p ⑼=1 p (1) = ^ p (2) = ^ 

可表示为图 4.1. 类似地，在掷两枚均匀骰子的试验中， 

令 X 为两枚敗子的点数之和，则 X 的分布列可用图 
4.2 表示. 



例 2 a 设随机变量 X 的分布 列为： …，其中入为一正 
数.求 ( a ) P { X =0}; ( b ) P { X >2}. 

解 ：因为 E ,~ oP (0 = 1- 我们有 



又因为 esESodA !, 因此 ce A = l , 也即 ，c = e - A 这样 

( a ) P{X = 0}= e - A A °/0! = e~ A 

( b ) P{X > 2} = 1 - P{X < 2} = 1 - P{X = 0} - P{X = 1} - P{X = 2} 



图 4.2 分布列 2 
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离散型随机变量的分布函数可通过分布列 p(a) 进行 计算： 
f'(a) = ^P(^) 

如果X是一个离散型随机变量，其可能取值为 mm …，其中 Xl <X2< 
X 3 < …， 那么它的分布函数是一个阶梯函数.也即，在区间 [Xi-uXi) 上取常数值, 
Xi 处跳一步，跳跃值为 p(Xi). 举例来说,如果X的分布列如下： 

p(l) = \ p(2) = ^ p(3) = ^ P ⑷=^ 

那么其分布函数为 

F(a) 



读者应该注意到， F(a) 在1,2,3,4处的跳跃值分别等于 A" 在该点取值的概率. 


4.3 期 望 

概率论里一个非常重要的概念就是随机变量的期望.如果X是一个离散型随 
机变量,并具有分布列 p ( x ), 那么久的期望 (expectation) 或期望值 (expected value) 
记为 E [ X ), 定义 如下： 

^[•^] = 51 印⑷ 

i:p(*)>0 

也就是说，X的期望值就是X所有可能取值的一个加权平均，每个值的权重就是 
X 取该值的概率.例如，如果X的分布列如下： 

P ⑼=\= p(!) 


E [ X \ = 0 x - + lx - = - 

这正是X的两个可能取值0和1在通常意义下的平均值.另外，如果 




那么 
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E l x ] = Ox- + lx- = - 
这正是两个可能取值0和1的加权平均，此处1的权重是0的权重的2倍，因为 

p ( l ). = 2 p (0). 

期望定义的另外一种来源是概率的频率定义.这个定义（见第8章给出的强 
大数定律）指出如果进行无限多次独立重复试验，那么对任一事件五,£发生的次 
数的比例为 P(E). 现在假设随机变量 X 的可能取值为 XX . X 2, •••,!„, 并且其相 
应的概率分别为 p(x 1 ),p(x 2 ),- -,p(x„), 与此同时，我们将随机变置 X 解释为一 
次机会游戏的贏得.每次游戏，我们以概率 p(xi) Mm xt(i = 1，2,…， n ) 个单位 • 
现在，利用频率解释，如果我们连续玩这个游戏，那么我们 贏得叫 的频率为?(^), 
i = 因此我们的平均贏得为 

^2xip(xi) = E[X]. 

i=l 

例 3 a 设 X 表示“掷一枚均匀骰子出现的点数”，求 E[X). 

解： 由于 p ( l ) = P (2) = p (3) =戸⑷= p (5) = p (6) = 1/6,这样可得 

E[X] = lxi + 2xi + 3xi+4xi + 5xi+6xi = ^ ■ 

例 3 b 我们称 J 是事件 4 的示性变置，如果 

/= fl 如果4发生 
一 >否则 

试求 E [ I ]. 

解 ：因为 p ( l ) = P ⑷， p ⑼=1 - P(A), 这样我们有芯 [/] = P(A), 即亊件>1的 
示性变量的期望就等于事件4发生的概率. ■ 

例 3 c 某人参加“答题秀”，一共有问题1和问题 2 两个问题.他可以自行 
决定回答的顺序.如果他先回答问题 i , 那么只有回答正确，他才被允许回答问题 
j(t / j ), 如果回答不正确，就不允许回答另一问题.如果他正确回答了问题他 f 
获得 V ；元奖励 （i = 1,2). 这样，一旦他两道问题都回答正确，他将获得 h + %元 
奖励.如果他能正确回答问题 i 的概率为 Pi(i = 1,2), 那么他先回答哪个问题才能 
使得获得奖励的期望值最大化？设事 件绞 ， i = 1，2表示“他能正确回答问题 i ” ， 
且玢,£ 2 相互独立. 

解： 如果他先回答问题1,那么他将获得的奖励 如下： 

0 概率为1 - 巧 

Vk 概率为 A (1 -朽） 

V ! + V 2 概率为朽巧 
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因此，这种情况下他获得的期望奖 励是： V 1 P 1 {1 - P 2 ) + (Vi + V 2 ) P l P 2 . 另一方面, 
如果他决定先回答问题 2 , 那么获得的期望奖 励是： V 2 P 2 (1 - Pi ) + (Vi + V 2 ) PiP 2 . 
因此，如果 ViP x (l - P 2 ) > V 2 P 2 (1 - Pi ) 成立,他应该先回答问题1，上式等价于 
V^iPi V2P2 
1 -Pi 〆 1- P 2 

这样，举例来说,如果他有60%的把握答对问题1，答对将获得200元奖励，有80% 
的把握答对问题2,答对将获得奖励100元,那么他应该选择先回答问题2,因为 


100 x 0.8 200 x 0.6 


例 3 d —个学校的120名同学分乘3辆大客车去听交响乐表演.第一辆车有 
36名同学，第二辆有40名，第三辆有44名.到达目的地后，从120名同学中随机 
抽取一名.令 X 表示被随机选中的同学所乘坐的车上的同学数，求 E [ X ). 

解： 随机抽取就意味着120名同学被抽中的可能性是一样的，所以有 
•!« 40 44 

^ = 36 > = S P ^ = 40 > = i20 ^ = 44 > = l20 

这样， 


o 1 11 1208 

£ [X] = 36x- + 40x- + 44x- = — = 40.2667 

另一方面，一辆客车上的同学数的平均值为 120/3 = 40. 计算表明随机抽取一 
位同学，他乘坐的车上的同学数的期望值要大于车上的同学数的平均值.这是很正 
常的，因为一辆车上同学越多，该车上的同学越容易被抽中，也即，同学数多的车所 
占权重要大于同学数少的车所占权重（见自检习題 4). ■ 

注释期望这一概念可以类比于质量分布 的重心 (Center of gravity ) 这一•物理 
概念.假定有一个离散型随机变童 X 具有分布列 pCxO.i > 1. 我们设想有一根没 
有重量的竹竿，在点 A 处放有质量 p(xi),i> 1( 见图 4.4). 那么能使竹竿保持平衡 
状态的点就是重心，对于具有静力学基本知识的读者来说，很容易找到这个点就是 
£[X]®. ■ 


p (- l )-0.10 p (0)-075 p ⑴ = 0.30 p (2)-0.35 
* :重 <1>0.9 

图 4.4 点上的质量 


①为了证明这点，我们要证明绕 E[X] 的力矩之和等于0,也即，我们要证明0 = Ei (而- ■ E [ x ]) p ( s <)， 
而这点很容易得到. 
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4.4 随机变量函数的期望 

如果已知一个随机变量 X 的分布列，如何计算 X 的函数，比如 g(X) 的期望？ 
下面介绍的是一种 方法： 既然 g{X) 本身也是一个随机变童，它便有自己的分布列， 
这个分布列可以通过 A ■的分布列计算得到.一旦贞义）的分布列得到了，那么就可 
以根据期望的定义来计算 g(X) 的期望 E\g(X)]. 

例 4 a 令 X 表示取值于 {-1,0,1} 的随机变量，其相应的取值概 率为： 

P{X = -1} = 0.2 P{X = 0} = 0.5 P{X = 1} = 0.3 

计算 E[X 2 ). 

解：令 y = x 2 , 那么 y 的分布列如下 

P{Y = 1} = P{X = -1} + P{X = 1} = 0.5 
P{Y = 0} = P{X = 0} = 0.5 

因此， E[X 2 } = B [ y ] = 1 x 0.5 + 0 x 0.5 = 0.5. 注意到 0.5 = E[X 2 ] ^ ( E [ X ]) 2 
= 0.01. ■ 
尽管用上述方法可以根据对随机变量 X 的了解求出一些有关 X 的函数的 
期望值，但是，对于 E[g(X)\ 还有另一种理解方法.注意到一旦 X = X, 那么， 
g(X) = g(x), 因此很合理地认为就是夕⑷的一个加权平均，每个权重就 
是 ； f = a : 的概率.这样，以下结论就非常直观. 


命题 4.1 如果 X 是一个离散型随机变量，其可能取值为 i > 1,相应取 
值概率为 p ( Xi ), 那么对任一实值函数3,都有 


在证明此命题之前，让我们考察例 4 a 中的随机变量 X ,先看看利用命题所得 
到的结果是不是与例 4 a 的计算结果 一致. 利用命题 4.1 可以得到 

五 [X 2 j = (-1) 2 x 0.2 + 0 2 x 0.5 + I 2 x 0.3 = 1 x (0.2 + 0.3) +0x0.5 = 0.5 

这个结果与例 4 a 的计算结果是一致的. 

命题 4.1 的 证明： 我们的证明方法是将和号 Ei 9 ( xi ) p { xi ) 中具有相同 g ( xi ) 
值的项合并.特别地，假设沁 ， j > 1,表示的不同取值，因此可得 

^2 g(xi)p(xi) =53 H s(xi)p(n) 52 奶 p 、 Xi 、 

i j i ： g(Xi)=yj i i:9(*i)=W 

= ^2yj 53 p( x <) = = Vi) = E \9( x )} □ 

j » ： s(*i)=yi i 
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例 4 b 某种季节性销售的产品，如果每卖出一件商品，可获得纯利润&元,如 
果季节末仍未卖出，则每件商品将损失 f 元.设某百货商店在某个季节的销售量 
(即卖出商品的件数）为一随机变量，其分布列为 p ( i),i > 0. 现在商店决定销售旺 
季前要囤货，问它要囤多少件才能使得期望利润最大化. 

m: 令 x 表示季节销售量，如果囤货数量为记利润为 p(s), p ( S ) 可表示为 


P(s) = 


bx-{a- x)e 

sb 


如果 X 彡 s 
如果 X > s 


因此，期望利润为 

^[^(*)1 = - ( a - + s6p ⑴ 

i=0 «=«+l 

=(6 + £) -s£^2p(i) + sfc[l-^p(*)] 

i=0 i=0 # i=0 ^ 

=(6 + <) ip(i) ~(b + t)s 亡 p(i) + 8b = ab+(b + i) 亡 (i - s)p(i) 

i=0 «=o <=o 

为了得到最佳的 S 值，我们来看看当 s 增加一个单位时，利润有什么变化.利用上 
述公式 得到： 

»+i 

E[P(s + l)] = 6(« + 1) + (6 + f) - 1)P(0 

i=0 

= 6( a + l) + (6 + ^)^(i-a-l)p(i) 


两式相减得 , 

£[ P (« + 1)]- E [ P ( a )] = b-(b+e) ^>( i ) 

«=0 

因此，如果下列条件满足，那么囤货数量为《 +1得到的期望利润会大于囤货数量 
为 S 的 情形： 8 

i >(0 〈口 （4. 1 ) 

i =0 

由于公式 （4.1) 的左边随着 s 的增加而增加，而右边为一常数，因此不等式对所有 
的 s 彡 a * 总是成立的，其中 s * 为满足 （4.1) 式的最大值.因为 

£[ P (0)] < • • -< E [ P ( s *)] < E[P{s m + 1)] > E[P(s* + 2)] > ••■ 

这样，囤货数量达到 s * + 1时将会使得利润最大化. ■ 

例 4 c 假设你要在两种行动方案之中选择其一，采取任一种方案都将导致下列 
n 个结果之一，记为 G ，…， C 7„. 假设采取了第一种方案,那么结果 G 发生的概率为 
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Pi , t = l ,--, n ; 如果采取了第二种方案，那么结果 G 发生的概率为 = - , n , 
其中 E ?= iP <= Er = i 9 i = l -下面提供一种选择行动方案的方法.一开始采取以下 
方式给各个结果进行 陚值： 首先，确定最坏和最好的结果，分别称之为 c 和 C , 并 
给最坏结果 c 赋值0,给最好结果 C 陚值1_现在考忠其他 n -2 个结果,不妨设为 
Ci . 为了给这些结果陚值，设想你有以下两种 选择： 获得 C “ 或者采取一随机试验， 
使得你获得结果 C 的概率为获得结果 c 的概率为1 - 很显然，你的选择依 
赖于 u 的取值，如果 u = 1,那么试验取得确定结果 C , 由于 C 为最好的结果,你肯 
定认为选择做试验优于选择获得另一方面，如果 u = 0,那么试验结果就是最 
坏的结果 c , 因此，这种情形下，很明显你会认为选择结果 G 优于选择做随机试验. 
现在,令 U 从1减小到0,那么会很合理地认为存在一点,在这点上，你认为选择做 
试验和选择获得 G 是一样的.也即，在严格的这点上，这两个选择是没差别的•那 
么令这个点所对应的概率 tx 为结果 Ci 的值.换句话说，你选择或选择做试验， 
以概率 u 获得结果 C , 以概率1 - u 获得结果 c , 使得这两者没差别的概率值就是 
Ci 的值.我们称这个概率值为结果 G 的故用 ( utility ), 记为 

为了确定哪个行动是最优的，我们要给每个行动估值.考虑第一个行动方案， 
其结果 G 发生的概率为 Pi, * = 1,2,我们可以认为这个行动方案的结果由 
一个两步试验决定,第一步，随机选择其相应概率为 P <, 如果选择了 <，那 
么获得结果然而，由于 G 相当于以概率 u ( Ci ) 获得结果 C , 以概率1 - U ( C 0 
获得结果 c . 这样，两步试验的结果就等价于以下一步 试验： 获得结果 C 或者 
其中获得 C 的概率为 Er = iP *«( Ci )- 类似地，选择第二个行动方案的结果等价于 
进行试验，获得结果 C 或者 c , 其中获得 C 的概率为 Er = i 9 < u ( C i ). 既然（：优 
于 C ， 这样第一个试验优于第二个试验，如果 E ?= iPM ^ i ) > E?=1 qMCi ), 换句话 
说,行动方案可以通过其结果的效用的期望值进行选 择使得 期望效用取得最大值 
的行动方案是最优的. ■ 


命题 4.1 的一个简单推论就是以下推论 4 .1- 



证明 


E[aX + 6] = 53(ai + b ) p ( x ) = a ^ xp { x ) + b 5^p(x) = aE [ X ] + b □ 

x:p(x)>0 x:p(x)>0 x:p(x)>0 

随机变量久的期望 E [ X ] 也称为 X 的均值或者一 阶矩. E [ X%n > 1称为 X 
的 n 阶矩.由命题4.1，可知 

E [ X n ) = 

* ： p(a)>0 
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4.5 方 差 

给定一随机变量 X 及其分布函数我们希望能通过定义合适的度量来概 
括 F 的本质属性，这也是十分重要和有意义的.一个比较好的度量是 X 的期望 
E [ X \. 然而,尽管 E [ X ] 可以得到 X 取各个可能值的加权平均,但是它并没有告诉 
我们任何关于取这些值的对均值的偏离程度，或者说散布程度等信息.比如说，尽 
管具有分布列 如下： 

W = 0 概率为1 

y=/-l 概率为 i / 2 z=i ~ 100 概率为^2 

- 1+1 概率为 1/2 - 1+100 概率为 1/2 

这三个随机变量具有相同的期望值 o , 但是 y 的取值散布程度要远远大于 w (取 
值为常数）的取值散布程度.而且， z 的取值散布程度也大于 y 的取值散布程度. 

由于我们认为久的取值在 E [ X ] 附近，这样，一个合理的度量 A " 取值散布程 
度的方法就是考察 X 的取值与 E [ X ] 的距离.一个可能方式就是考虑 E[\X - / il ], 
其中 p = E [ X ). 然而，在数学上处理这种度量是不方便的，因此，更容易处理的度 
憊通常考虑 X 与其均值距离的差的平方的期望，这样我们就有如下定义. 


定义设X 的期望为则 X的方差记为 Var(X), 定义 如下： 

Var(X) = E[(X- M ) 2 ] 

随机变量X的方差 Var(x) 就是刻画随机变童相对于期望值的散布程度的一 
个很好的度量.下面导出 Var(X) 的另一 公式： 

Var(X) = E[(X - /i) 2 ] = ^{x - n) 2 p(x) = ^(i 2 - 2/xx + im 2 )p{x) 

= 5 ^ x 2 p(x) -2n^2xp{x) + n 2 ^2p{x) 

= E [ X 2 ] - 2/ i 2 + m 2 = E [ X 2 ] - # x 2 


也即 


|Var(X) = g[X 2 l-(g[xj)^ 

X 的方差等于 X 2 的期望值减去 X 的期望值的平方.这也是实践中最方便计算 
Var ( X ) 的方法. 

例 5 a 掷一枚均匀骰子，记 X 表示掷出的点数，计算 Var ( X ). 
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解： 在例 3 a 中已经得到 E[X] = 7/2,利用命题 4.1, 得 
^ = l»x| + 2*xl +3 ^l + 4=xl + ^xl + 6=x 1 = 1x91 


因此， 


qi 

Var ( X ) =- 


鲁 35 


12 


对于任意常数 a 和6,下面的等式是十分有 用的： 


Var(oX + b) = a 2 Var(X) 

为了证明上式,令 m = S [ X ], 注意到推论 4.1 的结果 £[ oA - + 6] = an + b, 因此有 
Var(aX + 6) = E[(aX + 6-a/i-6) 2 ] = E[a 2 (X - / i ) 2 ] = a 2 £[(X - nf) = a 2 Var(X) 


注釋 （ a ) 在力学中，类比于均值是质童分布的重心，方差代表了惯性矩. 

( b ) Var ( X ) 的平方根称为 X 的 标准差 (Standard deviation ), 记为 SD ( X ), 也即 
SD ( X ) = v / Varpf ). 

离散型随机变量通常根据其分布列进行分类，下面的几节将要介绍几种常见的 
类型. 


4.6 伯努利随机变量和二项随机变量 

考虑一个试验，其结果分为两类，或者成功，或者失败.如果我们令 


1当试验结果为成功时 
0当试验结果为失败时 


那么； f 的分布列 如下： 

〆 ())= P{X = 0} = 1 — p 庐⑴= P{X = 1} = p (6.1) 

其中 P , 0 < p < 1 就是每次试验成功的概率. 

一个随机变量 X 称为伯努利随机变量(起源于瑞士数学家詹姆士.伯努利)，如 
果其分布列由 (6.1) 式给出，其中 ue (0，1). 

现在设进行 n 次独立重复试验,每次试验成功的概率为 P ， 失败的概率为 1- P . 
若以 X 表示 n 次试验中成功的次数，那么 X 称为参数为 ( n , p ) 的二项随机变量 
( binomial ). 因此，伯努利随机变量也称为参数为 ( l , p ) 的二项随机变量- 
参数为 （ n , p ) 二项随机变量的分布列为 

p(i)=(")p i (l~P) n - i i = 0 ， l，",n 


(6-2) 
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(6-2) 式的成立原因 如下： 首先注意到某特定包含 i 个成功和 n - i 个失败的 n 个结 
果的序列的概率为(由试验的独立性).又由于 n 个结果的序列里，包含 i 
个成功和 n - i 个失败的序列一共有0个,举例来说，如果„ = 4 ，i = 2 ,那么包含 

两次成功两次失败的试验结果序列一共有= 6种， 也即： ( s , s , f , f ),( s , f , s , f ),(8 ) f , f ,8), 
( f , s , 8 , f ),( f , s ， f ， 8 ) 及 ( f , f , s , s ), 其中 ( s ,8, f , f ) 表示前两次成功，后两次失败.既然每个结 
果序列的概率均为 沪(1 - p ) 2 , 那么在4次独立重复试验中 ， 2次成功的概率为 
(》) P 2 (1 - P ) 2 . 

由二项式定理知 

f>W = E ⑺外 - p)" _< = b+(i-p)] n = i 

i =0 »=0 

例 6 a 掷5枚均勻的硬币，假定掷各枚硬币所得的结果是相互独立的，求掷出 
的5枚硬币中正面朝上枚数的分布列. 

解 ：令； 1：表示掷5枚硬币正面朝上（成功）的硬币枚数，则 A " 就是一个参数 
为 （n = 5 ,p = 1/2) 的二项随机变景，因此，由公式（6.2)， 可得： 

p ( x -°>-(o)G)°G) 5 =s p ( x = i >=©©'© 4 =A 

P { X -2)»© (f Q ’ = 吴 Ppf - 3} - @ ( i ) 3 ( j) J = ^ 

例 6 b 某工厂生产螺钉，已知每•颗螺钉为残次品的概率为 0.01, 并且各螺钉 
是否残次品是相互独立的.工厂以10颗为一盒出售螺钉，并且承诺每盒里最多只 
有一个残次品，否则该盒作退货处理.问售出的产品中退货的比例. 

解：令 X 表示一食中有缺陷的螺钉的数量，那么 X 就是一个服从二项分布的 
随机变童，参数为 (10,0.01), 因此，任一箱将要退回的概率为 

1 - P{X = 0} - P{X = 1} = 1 - ( 1 J j > )(0.01) 0 (0.99) 10 — (^( O . OljHO . Qg ) 9 « 0.004 

因此,将要有0.4%的盒子被退回. _ 

例 6 C 以下介绍的赌博方法称为“运气轮”，在世界各地的狂欢节或赌场十分 
流行.赌徒押注于1到6之间某一个数，然后庄家掷3枚骰子，如果赌徒押的数出 
现 i，i = 1,2,3次，那么他将贏得 i 单位.反之，如果赌徒押的数没出现,他将损失1 
单位.问这个赌博对赌徒是否公平？（实际上，这个赌博经常是转一个轮子，当轮子 
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停下来时，指针会指向某结果，其结果会显示1到6之间的三个数字，但是从数学 
上来说，这两者是等价的 .） 

解： 我们假设骰子都是均匀的，而且掷出的点数相互独立，那么赌徒押的数出 
现的次数就是一个二项随机变量，其参数为（3,1/6)，因此，令 A " 表示赌徒贏得的 
数目，我们有 

P{X = 2)= ©① 2 ① 1 =盖 P{X = 3}=(|) ® 3 (^)°=2 l 6 

为了计算这赌博方式对赌徒是否公平，我们先计算 E [ X ], 利用以上概率可以得到 
-125 + 75 + 30 + 3 -17 

五⑷ = 216 = 216 

因此,如果长期赌下去，每216局，赌徒将要输掉17个单位. ■ 

接下来的例子我们考虑由孟德尔 （ G . Mendel , 1822—1884) 发展的遗传理论的 
最简单的一种形式. 

例 6 d 考虑人类的某-特别属性（比如眼睹的颜色,或是否左撇子等）是由他 
的一对基因决定的，以 d 表示显性基因，而 r 表示隐性基因，则有 dd 基因的是纯显 
性的，有 rr 的是纯隐性的，而有 dr 的就是混 合性. 纯显性的和混合性都显露出显 
性基因决定的特征.孩子从其父母身上各遗传得到1个基因，如果一对混合型父母 
总共有4个孩子，问其中3个孩子具有显性基因所决定的特征的概率有多大？ 

解： 我们假定每个孩子独立地从他的父母方各遗传得到1个基因，因此，当父 
母均为混合型时，孩子具有基因 dd , rr , dr 的概率分别是1/4,1/4, 1/2. 而具有基因 
dd , dr 的孩子具有显性基因所决定的特征，因此，孩子具有显性基因所决定的特征 
的概率为3/4,这样，他们的4个孩子中，具有显性特征的孩子数的分布是二项分 
布，参数为 n = 4 ,p = 3/4. 那么所求概率为： 

例 6 e 某陪审团的审判由12名陪审员参加.为宣判被告有罪，必须其中至少 
有8名陪审员投票认为他有罪.假设陪审员的判断是相互独立的，且每位陪审员作 
出正确判断的概率为问这个陪审团作出正确判决的概率有多大？ 

解： 上述问题是无法解的，因为还缺少足够的信息.例如，若被告是无罪的，则 
陪审团作出正确判决的概率为 

<=5 
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而若被告有罪，正确判决的概率为 

^(〒 y ( i - o ) 12 -‘ 

t =8 

因此，如果已知被告的确有罪的概率为 Q ， 那么以他是不是有罪为条件，我们得到 
陪审团作出正确判决的概率为 

( 〒 ) 分 (1 - 的 12_< + (1 - a) 負 0(1 - 0) 12 -* ■ 

例 ef —个通讯系统由 n 个元件组成，各个元件是否工作正常是相互独立的， 
并且各个元件正常工作的概率均为 p . 若在系统中，至少有一半的元件工作正常，那 
么整个系统就有效. 

( a ) p 取何值时，5个元件的系统比3个元件的系统更有可能有效？ 

( b ) —般来说，什么时候 2 fc + 1个元件的系统比 2 Jfc - 1个元件的系统更有效？ 
解： （ a ) 正常工作的元件数是一个服从参数为 ( n , p ) 的二项分布的随机变量，那 

么5个元件的系统有效的概率为 

② p 3 ( i - P ) 2 + gy ( i - P )+ P 6 
而三个元件的系统有效的概率为 

②作 - p )+ p 3 

因此，以下条件成立时, 5个元件的系统比3个元件的系统更 有效： 

10 p 3 (l - p ) 2 + 5 p 4 (l - p ) + p 5 > 3 p 2 (l - p )+ p 3 

化简为 3 (p - l ) a (2 p - 1) > 0, 即 jj > 1/2. 

( b ) —般来说，当（且仅当 ） p > l / 2 时 ， 2 fc + 1个元件的系统比 2 fc - 1个元件 
的系统有效.为了证明这点,考虑 2 fc + l 元件的系统，令 A " 表示“前 2 k-l 个元件 
中工作正常的元件的数目”，那么 

P 2 fc+i (系统有效 ） = P { X^k + l } + P{X = fc}(l 一 （1 - p ) 2 ) + P{X = k - l } p 2 

上式之所以成立是基于事件 “2 fc +1元件的系统有效”可以写成下列三个互不相容 
的事件的并： 

( i ) X^k + 1; 

( n ) X = k 而且剩下的 2 个元件中至少有1个工作 正常； 

( iii ) X = k -1 而且剩下的2个元件都工作正常. 
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由于 

P 2 fc - i ( 工作有效)= P{X = P{X = k } + P{X > Jfe + l } 

可得 


p 2 fc + l ( 工作有效）- p 2 *- l ( 工作有效） 

= P{X = k - l } p 2 - (1 - p ) 2 P{X = fc } 

= o*- 1 。- P )v - (i-P) 2 ( 2fe ~ >*(i -p )*- 1 

=(〜 v ( i - P )>-( i - rt ] 因为 ( n ) - cv ) 

> o 勞 p > 1/2 


4.6.1 二项随机变置的性质 

现在我们来考察参数为 ( n , p ) 的二项随机变量的性质，先来计算其期望和方差. 

职， = j ^ i k ⑺ P ‘(i - p )"- ‘⑺ P ‘(i - w * 

«=o »=1 

利用恒等式= o 可以得到 

= np^O + l )*- 1 ^- > (1 - p ) n ->- J ' 令 j = i - 1 
= np£；[(y + l ) fc - 1 ] 

其中， y 是一个参数为 (n - l , p ) 的二项随机变量.在上面的公式中，令 fc = 1,就 
可以得到 E [ X ] = np , 也即，如果试验每次成功的概率为 p ，那么 n 次独立重复试 
验的成功总次数的期望值等于 np . 在前面的公式中令 k = 2 , 再利用上面得到的 
关于二项随机变量的期望公式，可得 E [ X 2 ] = npE[Y + 1] = np[(n - l)p + l ], 因为 
E [ X \ = np , 所以可得 

Var ( X ) = E [ X 2 } - (£[ X ]) 2 = np[(n - l)p + 1] - ( np ) 2 = np ( l - p ) 

总结以上论述,可得如下结论. 

如果； t 是一个参数为 ( n , p ) 的二项随机变量，那么^ 

E [ X ) = np Var ( X ) = np(l — p ) 


接下来的命题表明，二项分布的分布列一开始是递增，后来逐渐递减. 
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命题 6.1 如果 X 是一个参数为 ( n , p ) 的二项随机变量，其中0 < p < 1. 
那么当从0到 n 时，= fc } —开始单调递增，然后一直单调递减，它 
在* = [( n + l ) p ] 时取最大值（记号[ X ]表示小于等于 X 的最大的整数). 

证明： 为证明这命题，我们考虑 P{X = k }/ P{X = k - l }, 对于给定的 fc 值， 
判定以下比值与1的大小关系. 


P{X = A :} 
P{X = ifc - 1} 



(n - A : + l)p 

— fe ( l - p ) 


因此， P{X = k }^ P{X = k - l } 当且仅当 ( n - fc + l ) p > Jk ( l - p ), 或者，等价于 
/c < (n + l ) p . 这样，命题得到了证明. □ 

图 4 .5为参数为 （10,1/2) 的二项随机变量的概率分布图. 



图 4.5 咻）=(?)(吾) 10 

例 6 g 在美国总统选举中，若候选人在一个州里获得了多数的选票，那么该候 
选人就贏得了分配给该州的全部选举团票.选举团票数正比于该州的人口数.设该 
州的人口数为 n , 选举团票数约为 nc (实际上，这个数约为 nc + 2, 该州的每•个众 
议员有一张选票，众议员人数正比于该州的人口数.而该州的参议员也有-张选票， 
而一个州的参议员只有2名).现在我们要 计算- 个选民的平均权力.所谓平均权 
力是与你的一票起的关键作用有关的量.例如，在某次会议上，你有决定权，你的权 
力就大.那么，在选举中，你的权力体现在哪里？设想这一州•共有 n =狄+ 1人 
( n 为偶数时，情况是类似的)，候选人共2人，除你之外其余的 2 fc 人对这两个候选 
人的态度一样，即选票中有 fc 个人支持候选人甲.另外*个人支持乙.在这种情况 
下，你的--票是关键的.若你支持甲，甲得胜，支持乙，乙得胜.现在，我们假定州里 
的 2 fc 个人的选择是相互独立的，并且每个选民选择甲或乙的概率都是 1/2. 这个 
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时候一个选民的选票起关键作用的概 率为： 

巧公民的选票起关键作用卜 ffl 总 

现在我们利用斯特林公式， 

〜 k k+l,2 e~ k V2a 

此处，似~ b k 表示当 fc — oo 时 a k / b k 1. 这样我们得到 


公民的选票起关键作用}〜 


(2kf k+1 ^e- 2k V2ii 

jfc 2fc + l e -2fc(2„) 2 2*= 




当你的选票起关键作用时，你将影响到 nc 张选举团票,这样，在一个人口为 n 的州 
里的选民，平均起来影响到多少张选举团票呢？我们用平均权力这个指标. 


平均权力 = nc _ P { 你的一票是关键的 } + 0 . 你的一票不起关键作用 } 

这样看来,你的平均权力与州的人 U 数的平方根成正比，在大州中-•票的平均权力 
比小州中的一粟的平均权力大. ■ 


4.6.2 计算二项分布函数 

设； f 是一个参数为 ( n , p ) 的二项随机变最，计算分布函数 

P{X = (?) p *(1 - P) n ~ k i = 0,l, - - ,n 

*=o 

的方法是利用在证明命题 6.1 得到的如下 P{X = fc + 1} 和 P{X = fe } 之间的关 

P{X = k + l } = r ^-^ P{X = k } (6.3) 

例 6 h 令 X 为一参数为 n = 6 ,p = 0.4 的 二项随 机变量.从 P{X = 0} = 
0.6° = 0.0467 开始,利用递推公式 (6.3) 可得 
P{X = 0} = 0.6® » 0.0467 P{X = 1} = ^ x ® P{X = 0} w 0.1866 

P{X = 2} = I X | p{X = 1} « 0.3110 P{X = 3}= 論 x ^ P{X = 2} w 0.2765 
P{X = 4} = g x ^ P{X = 3}« 0.1382 P{X = 5} = ■ x 警 = 4} « 0.0369 
P{X = 6} = ^ x ip{X = 5} w 0.0041 ■ 

很早就有人写了一个利用递推公式 (6.3) 计算二项随机变量的分布函数的程序. 
为了计算 P{X < i} 必须先计算 P{X = 0}®, 然后再利用递推公式计算 P{X = 1} 

①原书之义是先计算 P{X = >}, 再计算= < _ 1} 等，实际应先计算 P{X = 0}, 再计算 
p{x = 1} m. 译者注 
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和 P{X = 2}, 等等.这样的程序可在网站上找到.运行它时,直接输入二项分布的 
参数 n 和 p 以及一个值 i , 程序就会计算出参数为 ( n , p ) 的二项随机变童小于或等 
于 i 的概率. 


历史注记 

瑞士数学家雅克.伯努利 (Jacques Bernoulli , 1654—1705) 首次研究独立重复 
试验（每次成功率为 P ). 在他去世后的第8年 （1713 年)，他侄子尼克拉斯出版了伯 
努利的著作《推测术》.在书中，伯努利指出了如果这样的试验次数足够大，那么成 
功次数所占的比例以概率1接近 P . 

雅克.伯努利是这个最著名的数学家庭的第一代.在后来的三代里，一共有8 
到12个伯努利，在概率论、统计学和数学上作出了杰出的基础性贡献.知道其具 
体数目比较困难，一方面是有好几人的名字相同（比如，雅克的兄弟让有两个儿子 
分别叫雅克和让)，另一方面是有几个伯努利在不同的地方有不同的名字.比如，我 
们刚说的雅克（有时也写成 Jaques ) 有时叫雅可布（也写成 Jacob ) 或詹姆士 • 伯努 
利.但不管如何，他们的成果和影响都是非 凡的. 正如巴赫家族之于音乐，伯努利 
家族在数学界是非常有名的家族！ 

例 6 i 设； f 是一个服从参数为 n =100 ,p = 0.75 的二项随机变量，求 P{X = 
70} 和 P { X ^ 70}. 

解： 如图 4.6 所示. 



图 4.6 统计软件计 算概率 


4.7 泊松随机变量 

—个取值为0,1,2…之一的随机变量称为服从参数为 A 的泊松随机变量 (Poi 
sson ), 如果对某一_\ > 0,有 

p ( t ) = P{X = t } = e_A ^" i = 0,1,2, •■- (7-1) 

公式 （7.1) 定义了一个分布列，因为 
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f ： p ( i ) = e -^= e -^ = l 

t=l i=0 ' 

泊松分布是 S . D . 泊松在他所著的关于概率论在诉讼、刑事审讯等方面应用的书中提 
出的，这本书于 1837年出版,法文书名叫 flec / ienc / i « sur Za probabilite des jugements 
en matiire criminelle et en matiire civile . 

泊松分布在各种各样的领域中有着非常广泛的应用，这是由于当 n 足够大 ， p 
充分小，而使得 np 保持适当的大小时，以 ( n , p ) 为参数的二项随机变量可近似看 
作泊松分布.为证明这点，设 X 是一个服从参数为 ( n , p ) 的二项随机变量，并且记 
A = np , 这样 

P{X = i}= ( n - i )! x ! pi(1 - P)n " <= ( n - i )!'<! Q -会) 

_ n(n - 1 ) … (n - i +1) A * (1 - A / n) w 
n * t ! (1 — A / n )* 

由于对充分大的 n 和适当的 A , 有 

(卜会卜-入 n ( n - l )-^( n-i + l )^ 1 Q _ 会)‘《 i 

因此，有 

P{X = t }« e - A - 

也就是说，独立重复进行 n 次试验，每次成七率为 p , 当 n 充分大，而 p 足够 
小，使得 np 保持适当的话，那么成功的次数近似服从参数为 A = np 的泊松分布， 
这个 A 值（以后将要证明这就是成功次数的期望值）通常凭经验确定. 

以下例子中的随机变童通常都服从泊松分布（也即满足公式 (7.1))： 

1. 一本书里一页或若干页中的印刷 错误； 

2. 某地区居民活到100岁的 人数； 

3. —天中拨错电话号码的 总数； 

4. —家便利店里每天卖出狗粮饼千的盒数： 

5. 某一天进入某邮局的顾 客数； 

6. 一年中联邦司法系统中空缺位 置数； 

7. 某放射性材料在一定时期内放射出来的 a - 粒子数 • 

还有其他大量的随机变量，都因为相同的原因近似服从泊松分布，也即，因为 
泊松分布与二项分布很近似.例如，我们认为某一页上任一字母出现印刷错误的概 
率 P 是一个很小的数，因此，这一页上总的印刷错误近似服从参数为 A = np 的泊 
松分布，其中 n 是该页上的字母数.类似地,我们还认为某个地区某人能活到100 
岁的概率 很小； 同样，进入某家商店的顾客购买一袋狗粮的概率也可以认为是很小 
的数,等等. 
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例 7 a 假设本书的某一页上的印刷错误数服从参数为1/2的泊松分布，计算 
该页上至少有一处错误的概率. 

解：令 X 表示该页上的错误数，我们有 


P{X > 1} = 1 - P{X = 0} = 1 - e _1/2 W 0.393 


例 7 b 假设某台机器生产出来的零件为残次品的概率为 0.1， 计算有10个这 
样的零件的样本中至多有一个残次品的概率有多大？ 

解： 所求概率为 O x 0.1 0 x 0.9 10 + O x 0.1 1 x 0.9® = 0.7361，而利用泊 
松分布近似可得该概率值为 e -^ e - 1 « 0.7358. ■ 

例 7 c 考虑这样一个 试验： 记录1克放射性物质在1秒内放出的 a 粒子数. 
如果从过去的经验得知，这个数目的平均值为 3.2, 问放出的 a 粒子数不超过 2 的 
概率的较好的近似值是多少？ 

解： 设想这1克放射性物质由 n 个原子组成 （ n 相当大)，每个原子在所考虑 
的1秒内蜕变并放出一个 a 粒子的概率为 3.2/ n , 于是我们可看到，放射出的 a 粒 
子数近似服从参数为 A = 3.2 的泊松分布.因此,所求的概率为 

P{X ^2} = e -3 ' 2 + 3.2 e -3 2 + ^- e -3 ' 2 w 0.3799 ■ 

在计算参数为 A 的泊松随机变量的期望和方差之前，回顾它近似于参数为 n 
和 p (其中 „很大, p 很小 , A = np ) 的二项随机变量,而这个二项随机变量的期望值 
为 np = A , 方差为 np(l - p ) = A (1 - p ) w A (因为 p 很小).这样，看起来好像泊松 
随机变量的期望和方差都等于其参数九下面我们来证明这—点 • 








4-j = 


因为乙 7 


因此，泊松随机变 ft X 的期望等于其参数 A ， 为了计算其方差，先计算 E [ X 2 ). 

朴 g 穿 - L 唁中令 h - 1 

=a [§^ + S 守卜 ( A+1 ) 

其中，最后一个等式成立是因为第一项就是参数为 A 的泊松随机变量的期望，而第 
二项就是该随机变量取各个值的概率之和.因此，由于我们已经得到五[义]= 、可 
得 Var ( X ) = £[X 2 ] - (£?[X]) 2 = A. IP 
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厂 泊松随机变量的期望和方差都等于其参数 A . 1 

我们指出了参数为 np 的泊松分布是对 n 次独立重复试验（每次成功的概率 
为 P ) 中成功次数的较好的近似,其中给定条件 n 很大而 p 很小.事实上，在试验 
并不独立，但是弱相依条件下仍是比较好的近似.例如，匹配问题（第2章例 5 m ), 
其中 n 个人随机地从他们的帽子中取一顶帽子，考虑恰好拿着自己的帽子的人数. 
可认为这 n 个选择就是 n 次试验，其中第 i 次成功就是第 i 个人拿到了自己的帽 
子， i = l , …， n . 定义事件尽， i = ：[,••• ,n 如下： 


Ei = {第〗 次试验成功 } 

很容易看出 P { S <} = l/n,&P{Ei\Ej} = l /( n - l ), i # i , 那么很合理地认为成功 
的次数近似服从参数为 n x 1 /n = 1的泊松分布，事实上，这一点己经在第2章例 
5 m 得到了证明. 

现在给出第二种关于试验为弱相依情形下泊松近似的阐述，考虑第2章例 5 i . 
在该例中，假设有 n 个人,每个人在一年365天内任一天过生日的概率都相同，现 
在的问题是计算 n 个人生日各不相同的概率.我们曾用组合学知识计算了该概率, 
并计算出当 n = 23时该概率小于 1/2. 

我们可以利用泊松近似来给出上述概率的近似值.设想我们进行一系列试验, 
对于不同的 i 和 j (两个人)，称试验 i , j 为成功，如果 i 和 j 生日相同.如果我们令 
E { j 表示事件“试验 i ， j 成功”，那么这个事件 EijA ^ iKj ^ n 并不独立 
(见理论习题21)，但其相依性却很弱（事实上，对于不同的五 y 与五 fci 是 
相互独立的，见理论习题 21). 由于 PiEtj ) = 1/365,因此，假设成功次数近似服从 
参数为(幻 /365 = n ( n - l )/730 的泊松分布是很合理的.因此 

P { 没有2个人生曰相同 } = P {0 个成功 } » exp { H ) } 

现在计算该概率小于1/2的 n 的值,注意到 


exp 




等价于 




>2 


两边取对数，可得 n(n -1) > 730 In 2 « 505.997. 这样，可以得 到解 ： n = 2 3. 这与 
第2章例 5 i 的结论是一致的. 

现在考虑我们想要得到没有3个人同一天生日的概率，这时用组合学知识去 
解决就变得相当困难了，但仍可以用简单的方法得到一个较好的近似.首先，设想 
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我们对个 1 < * < i < fc < n 做一次试验，试验称为成功的，如果 i , J _, A : 
这3人生日相同.如上所述,我们知道成功数近似为泊松随机变童，参数为 

人生日 _ = ©(sk) S = "("6? ^ 

因此， 

P { 没有 3 人 生日棚 }- expf "^- 1 ^- 2 )} 

该概率值小于1/2,若 n 满足 n(n - l)(n - 2) > 799 350 In 2 w 554 067.1, 等价于 
n >84, 因此，当人数超过 84 时，至少有3人生日相同的概率超过 1/2. 

因此要使事件发生的数量近似服从泊松分布，并没有必要要求各个事件发生的 
概率相同，只要这些概率都较小即可.下面就是泊松范例 • 

泊松范例考虑 n 个事件，每个事件发生的概率为 Pi ,t = l , - - , n . 如果所有 
Pi 都很小，且试验或者独立，或者至多弱相依，那么事件发生次数近似服从参数为 
E ?= iPi 的泊松分布 • 

接下的例子不但应用了泊松范例，而且阐述了前面介绍的一系列技巧 • 

例 7 d (最大游程的长度）抛掷硬币 n 次,假定各次抛掷是相互独立的，每次抛 
掷正面朝上的概率为 P . 出现连续 fc 次正面朝上的概率有多大？ 

解： 首先应用泊松范例逼近这个概率.对于 i = 1,... , n-fc + l , 令私表示“第 
《，《 +1 ，...，纟+ * : - 1 次抛掷硬币均为正面朝上”.此时，连续 A : 次正面朝上的概率 
就是至少有一个私发生的概率.由于是“第 + ，i + *： _ 1次抛掷硬币 

均为正面朝上”， P (执）= p * •当 p fc 很小时，执发生的次数应该近似具有泊松分 
布.但是，这是不对的，因为尽管各事件氏发生的概率很小，而某些事件之间的依 
赖性很大，影响了泊松逼近的 精度. 在第 1,...， fc 次抛掷硬币的结果都是正面朝上 
的条件下，第2, •••# + 1次抛掷硬币的结果都是正面朝上的概率等于第 fc + 1 次 
抛掷的结果为正面朝上的概率.即 P [ H 2 \ H l )= p , 这个概率比 P { H 2 ) 大得多. 

为了应用泊松逼近，对于 i = l ， …， n - fc , 令尽为“第 i，i + l， …， i + fc -1 
次抛掷的结果都是正面朝上，而第 i + A : 次抛掷为反面朝上” •而为“第 
n-k + l ,---, n 次抛掷都是正面朝上”，这样我们得到 
P ( Ei ) = 沪(1 - p ) i ^ n-k 
P ( E n - k+1 ) = p k 

这样，当很小时, P ( Ei ) 都是小概率事件，对于 五 i 和馬，当它们所涉及的试 
验没有相重的时候, P ( Ei \ Ej ) = P ( Ei ), 如他们涉及的试验有相重部分， P ( Ei \ Ej ) = 
0. 在这两种情形下，条件概率都可以为是无条件的. 令 N 表示 Ei 发生的次数 ， TV 
的分布应该近•(以为泊松分布，其期望为 
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n—k+l 

E[N]= 53 P ( E i) = (n - k)p k (l - P) + P k 

i=l 

不存在 A ： 次连续正面朝上的充要条件为 AT = 0 .因此 

P { 不存在 fc 次连续的正面朝上 } = P{N = 0} w exp{—(n — fc ) p*(l — p ) — p *} 


现在令为 “ n 次试验中连续出现正面的最大次数”，亦即 L „ 为 n 次试验中的 
出现正面的最大游程的长度.易知 L „ < * 的充要条件是试验序列中没有次连续 
正面朝上的一段.因此,利用上式 


P { L n < *：} » exp{-(n - k ) p k (l - p )- p k } 


现在假定硬币是均匀的，即 p = 1/2,此时上式变成 

P{L„<fc}»exp|-^Z j *^|«exp{-^ r } 

上面最后的近似式利用了 exp{(fc - 2)/2 fc+1 } « 1 或 （fc - 2)/2 fc+1 w 0. 令 _;• = ln 2 n , 
并假定为整数，令 *： = j + i , 有 


显然， 

由此可知 


n _ n 1 

2*+i — 2^2* +1 — 2 i+1 

P { L n <i + *}« exp {-( l /2) <+, } 


P{Ln = j + i } = P { L n <j + i + l}~ P { L n <j + i ] 
« exp {-( l /2) <+2 } - exp {-( l /2) <+1 } 


例如， 


P { L „ < j - 3} « e -4 w 0.0183 P { L n 

P { L n = j - 2} w e -1 - e -2 w 0.2325 P { L n 

P { L n = j }« e _1/4 - e _1/2 w 0.1723 P { L n 
P { L n = i + 2} « e -1/ie - e -1/8 « 0.0569 
P { L n = j + 3} « e - " 32 - e _1/16 « 0.0298 
P { L „ ^ j + 4} w 1 - e _1/32 « 0.0308 

由上式看出，不管 n 有多大, n 次试验的最大的正面朝上的游程的长度在 ln 2 ( n )-3 
和 ln 2 ( n ) + 1之间的概率大约为 0.86. 

现在我们要导出在 n 次抛掷硬币试验中，连续 fc 次出现正面的概率（每次抛 
掷硬币正面朝上的概率为 P ). 利用记号 L „ 及及，我们有 


j - 3} we -2 - e _4 w 0.1170 
： j - 1} w e _ V 2 — e — 1 w 0.2387 
j + l }« e -,/8 - e -1/4 «0.1037 
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n—fc+l 

P ( in > fc ) = P { 在 U 次试验中出现连续 fc 个正面向上 } = P ( ( J 五0 

«=1 

利用事件和的概率的容斥恒等式， 

n—fc+1 n—fc +1 

p{ U E >)= E (-!) r+1 E p n) 

«=1 r=l 


令氏表示与事件尽相关联的试验号的集合.例如 ， Si = { I ,--- ,fc + l }. 现在考 
虑玢，…中 r 个事件的交的概率（把事件 E n _ fc +1 排除在考虑之列)，即考 
虑 P ( E 4l - - - E ir )ii <--< i r < n-k + i ,^ S u , - , S ir 中任何两个集合有相交的 
情况， P ( E il - E ir ) = 0. 如果两两不相交，则 E it , -, E ir 是相互独立的，这样 
、 fo 若知，…，心中有两个相交的情况 

P \ Ei x - - - Ei r ) = < 

\ p rfc ( l - p ) r 若5“ ，…， So 互不相交 

现在我们要确定 ii < ••- < i r < n-fc + 1 中使得 ，■ - , S ir 互不相交的组数. 
首先注意到，对于每个集合 S ti ,j = 对应了 k + 1 次抛掷硬币.而这些 

集合又不相交，一共对应于 r(ifc + 1) 次抛掷硬币.现在考虑 r 个相同的字母 a 和 
n - r(fc + l ) 个相同的字母6的排列，其中每个 a 对应于一个集合每个 i > 对应 
于 Syj = 1,". ，》•以外的一个指标.现在假定这些 a 和6已经排好一 顺序. 每一 
个排列对应于不相交的指标集 Si ”…、 S ir 的一种选择.排列的第一个 a 前面的<> 
的个数代表 S 4 l 之前的试验的次数.若第一个 a 前面有0 _ 1个6, 那么氏 ，刚好 
由 {iuh + 1 ,…， h W 组成,而排在第一个 a 与第二个 a 之间的6的个数，刚好 
对 应于乳 之后，知之前的试验次数 ，…. 由于这些 a , 6的排列共有 ~ r rk ) 
每一个排列对应于一个不相交的 S u 、 …， S ir 的一种选择,这样 


E …= ( n ~ rk ) p rk ( l ~ P) r 

ii 々-•<*!■<»»— fc +1 

注意到在事件和的容斥等式里边的相应的求和公式为 


我们将这个和号进行分解 ® 


P ( E it - Ei ^) = 5 Z P (£ i , - E ^) 



+ ^2 P(£j, - - - Ei^En-k+l) 


①原文并没有这个和号分解，译者为便于读者理解，添加了此内容.——译者注 
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=( n ~ rfc ) p rfc a - p ) r + E p ( n , K - fc+1 ) 

在上式右边第二个和号内的各项的计算和第一个和号的计算是一样的.当 
屯，…， S ‘ •” 5„_ fc 中某两个集合相交时， PiEi , ■■- Ei ^ En - k ^) = 0 .当知 ，…， 
S iri , s n . k + l 两两不相交时， 

p ( e u ■■- n * +1 ) = ( p*(i - p ) r _ v = p fcr a - p ) r_1 

这样， 

X ； P (五“… E ir _ l E n . k+l ) = K - p n - r (l - py - 1 

其中 K 是不 相交子知 ，…， 5^,, S „_ fc 的 数目. 这个数目等于 （r _ 1) 个 a 和 
n - (r - l)(fc + l )- k ^ b 的合在一起的排列数.这个排列数为(^-^).将所得 
到的公式代入 P ( L n > k ) 的表达式，得到 

"f Vir 1 [( n _/*) + -p) r 

r=l y 

在上式中我们规定 =0, m < j . 

从计算的角度看存在更有效的方法计算上述概率，其方法是导出一个递推公 
式.令表示“在 n 次抛掷硬币的试验中出现连续 fc 次正面朝上”的事件，记 
P „ = 巧>1„).记&表示 “ n 次试验中第一次反面朝上在第:/次抛掷硬币时出现”， 
用 H 表示“前 fc 次都是正面朝上”，朽，巧，…，形成一个互不相容的完备组. 
我们有 fc 

P (, An ) = E P (人 内) P ( f >) + P ( A n \ H ) P ( H ) 
j'=i 

由于第一次反面朝上是在第 ：?• 次试验出现 ， j < fc . 而我们要出现 fc 次连续正面， 
因此前 j 次试验不起作用，相当于试验重新开始，于是 P (, A n \ Fi ) = Pn - J , 又由于 
P ( An \ H ) = 1,我们得到 

k k 

Pn = P { A n ) = J 2 Pn - jP ^ Fj ) + P ( H ) = ~ P ) + P * 

i=i i=i 

由于巧 = 0 ,j < * 及 Pfc = P fc , 我们利用上式递推算出 P k + l , Pk + 2, ' ,直至算出 
P n . 例如，我们希望计算出在 4 次抛掷一枚均勻硬币中出现 2 个连续正面朝上的 
概率 ， k = 2, P l =0, P 2 = ( l / 2) 2 = 1/ 4,利用公式 



136 第 4 聿随机变量 


得到 


p 3 = O +巧 q 2 O I ^= p 3 ( X ) 2 + Q 2 =| 

这显然是正确的.因为 4 次抛掷硬币，连续两次出现正面的情 况为： hhhh , hhht , 
hhth , hthh , thhh , hhtt , thht 和 tthh , 共有 8 种情况，每种情况出现的概率为 
1/16. ■ 

泊松分布的另一应用表现在这样的情形中，“事件”发生在某些时间点上.这 
种事件的例 子有： 发生一次地震，某人进入特定地点（如银行、邮局、加油站等)，爆 
发一次战争等.我们假设这样的事件发生 在一列 （随机）时间点上，并设存在某个 
正的常数 A 使得如下条件成立. 

1. 在任意长度为的时间区间内，正好发生一个事件的概率彼此相同，都等于 
Xh + o { h ), 其中 0 ( h ) 表示任何满足 lim h _ o /( h)A = 0 的函数 f ( h ). [例如 f ( h ) = h 2 
是 o ( h ), 而 /( ft ) = h 不是 o ( h ).] 

2. 在任意长度为的时间区内发生2个或更多个事件的概率非常小，等于 

o(h). 

3. 对于任意确定的自然数 n 与非负整数 j u j 2 , …， j n , 以及任意 n 个互不相 
交的时间区间，若以尽表示“在第 i 个时间区内上述亊件正好发生 力次” ，则 
EuEh …， E n 相互独立. 

粗略地说,条件1与条件2说明，当/ I 比较小时,在长度为/ I 的区间内正好发 
生1个事件的概率等于 A / i 加上某个比/ I 更小的量,而事件发生多于一次的概率就 
是一个比/ I 更小的量.条件3说明，在一个时间区间内无论发生了什么，对另一个 
与它不相交的区间（从概率意义上）没有影响. 

在条件1, 2与3成立的假设下，我们证明，在任意长度为 t 的时间区间内，事 
件发生的次数是以 M 为参数的泊松随机变童.为此，我们考虑区间并以 7 V (*) 
表示“这个区间内事件发生的次数”.为求出= A } 的表达式，先将区间 
[0, t ] 等分为 n 个互不相交且长度为 t / n 的子区间（图 4.7). 



图 4.7 对区间|0,约等分 

我们有 
尸帅)= *} 

= P { n 个子区间中某 fc 个正好各含1个事件而其余 n - 个子区间各含0个事件 } 
+ P { N ( t ) = fc 且至少1个子区间含多于1个事件 } (7-2) 
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显然，等式 （7.2) 是因为事件 { N { t ) = k ] 等于右边两个互不相容事件 之并. 以 >1 与 
B 分别表示 （7.2) 式右边这两个互不相容事件，便得到 


P(B)< P{ 至少一个子区间包含多于1个事件 } 

= p(U 第 i 个子区间包含多于1个事件 } 

«=1 

第 i 个子区间包含多于1个事件 } 用布尔不等式 

«=i 

因对任何 t, 当 n — oo 时， f/n -* 0,从而由 o(/i) 的定义可得，当 n — oo 时， 
o(t/n)/(t/n) —* 0. 因此，当 n — » oo 时， 


P ( B ) -» 0 (7.3) 

另一方面，由于条件1与条件2 组涵① 

在长度为 h 的区间内有0个亊件发生 } 

=1 — [A/i + o { h ) + o(/i)] = 1 — Xh — o ( h ) 


又由独立性条件 3 可得 
P{A) 

=P{n 个子区间中某 fc 个正好各含1个事件而其余 n - fc 个子区间各含0个事件 } 


=(3[^七)作-(当 -#)r 


但因当 n —♦ oo 时， 

n [^ +o 0] =At+t [ £ v?]^ At 

故采用与证明二项随机变量的泊松近似相同的方法可证，当 n — oo 时， 

P(i4) _e- At ^ (7-4) 

因此，由 (7.2),(7.3),(7.4) 式，令 n — oo, 我们得到 

P { N ( t ) = k } = k = 0,1,2,-■■ ( 7 - 5 ) 

①两个形如 o(h) 的函数之和仍为 o(/»), 这是因为，若 lim f ( h)/h = = 0, 則 Um[/(h)+ 

g ( h)]/h = 0. 
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这样，如果事件的发生满足条件1，2, 3,则在任何固定的长度为*的时间区间 
内，事件发生的次数是以 At 为参数的泊松随机变量.这时，我们称事件是按速率为 
A 的泊松过程发生的.数 A 可解释为单位时间内事件发生的速率.它一定是由经验 
确定的常数. 

上述讨论阐明了为什么泊松随机变 ft 通常可作为诸如下列各种现象的很好的 
近似. 

1. 发生在某固定时间间隔内地震的次数； 

2. 每年爆发战争的次数； 

3. 在某固定周期 内从一 个热阴极放射出的电 子数； 

4. 某人寿保险公司的保险客户在某一时间区间内死亡的个数. 

例 7 e 美国西部发生地震的次数符合上述假设1, 2, 3,且以1周为单位时间, 
速率 A = 2( 即地震发生的次数符合上述3个假设，并且每周发生的次数为2次). 

( a ) 接下来2周内至少发生3次地震的 概率； 

( b ) 从现在开始到下次地震的持续时间的概率分布. 

解： ( a ) 由 (7.5) 式，有 

P { N (2) 彡 3} = 1 - P { N (2) = 0} - P { N (2) = 1} - P { N (2) = 2} 

=1 - e ~ 4 - 4 e ~* - i - e -4 = 1 - 13 e -4 

( b ) 令 A ： 表示“从现在开始到下次地震时间的时间间隔”（单位 ：周) .因为 X 
大于 t 的充要条件是接下来的时间*内不发生地震，由 （7.5) 式得 
P{X >«} = P { N { t ) = 0} = e~ M 
因此，随机变量 X 的分布函数 F 为 

尸⑴= P{X < t } = l - P{X > t } = 1 - e~ xt = 1 - e _2t _ 

计算泊松分布函数 

如果 X 服从参数为 A 的泊松分布，则 

P{X = i + l } e - W <+1 /(i + l )! _ A 
P{X = t } - ~ e - W / i ! i + 1 ( 1 

从 P {X = 0} = e - A 开始，利用 （ 7 . 6 ) 式可以计算以下 
P{X = 1} = \ P{X = 0} 

P{X = 2} = ^ P{X = 1} 


P{X = i + l } = r ^ TP{X = i } 
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网站上有一个程序,利用式 （7.6) 来计算泊松分布的有关概率. 

例 7 f 

⑷ X 服从泊松分布，均值为100,计算 P{X < 90}. 

( b ) y 服从泊松分布,均值为1000,计算 PiY ^ 1075}. 
解： 利用网站上的程序可求得 

( a ) P{X 彡 90} « 0.1714. 

( b ) P{Y ^ 1075} w 0.9894. 

4.8 其他离散型分布 


4.8.1 几何随机变置 

考虑独立重复试验，每次成功率为 p ,0< p < 1,—直进行直到试验成功.如果 
令 X 表示需要试验的次数，那么 

P{X = n } = (1 - p) n ~ l p n = 1,2,••- (8.1) 

上式成立是因为要使得 X 等于 n , 充分且必要条件是前 n - 1次试验失畋而第 n 
次试验成功.又因为假定各次试验都是相互独立的，因此 （8.1) 式成立 • 

由于 OO ~ 

f ： nx = n }= P f ：( i - P r- l = i — = 1 

n=l n=l V ' 

这说明试验最终会出现成功的概率为 1. 若随机变量的分布列由 （8.1) 式给出，则 
称该随机变量为参数为 P 的几何 ( geometric ) 随机变黃. 

例 8 a —个坛子里有 W 个白球和 M 个 黑球. 每次从中取出一个球，观察球 
的颜色并放回，重复这个过程,直到取出一个黑球，求以下事件概率： 

( a ) 正好取球 n 次； （ b ) 至少取球 A : 次. 

解：令 X 表示要取出一个黑球需要取球的次数 ，则义 满足公式（8_1)，其中 
p = M/(M + N ), 因此 

( a ) , . 

(N \ n_1 M _ MiV "- 1 

P 、 X = n}= \M + N ) M + N = {M + W 

( b ) 

P { X > fc }= MTlv £( Mf 7 v) n * 

= (為)疒 Vt 1 _ = (^广 1 
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问题 （ b ) 的答案可以直接得到，因为至少需要 ifc 次取球意味前 A : - 1次拿到的都是 
白球，亦即前 fc - 1次试验都失败.这样,对于一个服从几何分布的随机变量， 

奶* } = (1 -#-，= ( 士广 • 

例 8 b 计算几何随机变量的期望. 

解：令 g = l - p ， 我们有 

E l X \ = ^2 O = 1^(* - 1 + 1)9 <_， P = 5^(* - l)? <_1 P+5^9 <-1 P 

*=1 i=l »=1 {=1 

oo oo 

= Wp + 1 = 9^ ZjV - i P + 1 = qE [ X ] + 1 
j=o i=i 

因此 pE [ X \ = 1, 由此得到 E [ X ] = 1 / p . 也就是说,•-个成功的概率为 p 的试验，如 
果独立重复进行直到试验成功，那么需要进行的试验的次数的期望等于 1/ p . 举例 
来说,掷一枚均匀骰子，直到出现一次点数为1,需要掷的次数的期望为 6. ■ 

例 8 c 计算几何随机变量的方差. 

解： 为了计算 Var ( X ), 先计算 E [ X 2 ], 记 9 = 1 - p , 我们有 

E[X 2 ] = £ <V -1 P = - 1 + 1)V _1 P 

i=l i=l 

= !!(*•- ” V _1 P + Z 2(i - l)q i ~ 1 p+J2q i ~ 1 p= J^jVp + 2^)jVp+l 

i=l i=l t=l j =0 j=l 

= qE[X 2 ] + 2qE[X) + 1 


利用公式 E [ X ) = 1/ p , 由上面的公式得到 

pE [ X 2 ) =苎 + 1 
P 

因此， 

再利用方差的公式得到 


Var ( X ) = E [ X 2 \ - (£[ X ]) 2 


g + 1 1 _ q — 1—p 

P 2 P 2 ~ P 2 ~ P 2 



4.8.2 负二项分布 

考虑独立重复试验，每次成功的概率为 p ,0< p < 1,试验一直进行到一共累计 
成功了 r 次为止.令 A ： 表示此时试验的总次数，则 

n = r,r + l , ••- (8.2) 
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公式 （8.2) 之所以成立是因为，要使得第 n 次试验时正好是第 r 次成功，那么前 
n -1 次试验中有 r _ 1次成功，且第 n 次试验必然是成功，“前 n - 1次试验中有 
r - 1次成功”这一事件的概率为 

( r - l ) P， " 1(1 - P) "' P 

而“第 n 次试验成功”的概率为 p . 因为这两事件相互独立，将两个概率值相乘就 
得到 (8.2). 要证明如果试验一直进行，那么最终一定能得到 r 次成功，只需用分析 
的方法证明 oo oo 

g X = n } = g (; 二 J)，(1 — p )”- = 1 (8.3) 

或者我们可给出如 T 的概率论证的得到 r 次成功所需的试验次数可以分解 
为 Vi +妁 +… + y r ，其中 Kl 表示第一次成功时试验的次数， y 2 表示第一次成功 
之后，直到第二次成功时所需的试验次数， y 3 表示第二次成功之后，直到第三次成 
功所需的试验次数，等等.因为试验是相互独立的,且每次成功的概率都为 P , 所以， 
都为几何随机变量.而几何随机变量 K 都是以概率1取有限值，因 
此, EUi y i —定为有限值.这样 （8.3) 式就得到了证明. 

若随机变量 X 的分布列由 (8.3) 式 给出，那么称 X 为参数为 ( r , p ) 的负二项 
(negative binomial ) 随机变量.注意几何随机变量就是参数为 ( l , p ) 的负二项随机 
变董. 

接下来的例子，我们将要利用负二项分布来得到关于点的问题的另一个解法. 
例 8 d 进行独立重复试验，每次成功的概率为 p , 求第 r 次成功发生在 m 次 
失败之前的概率. 

解： 注意到当且仅当第 r 次成功的时刻不晚于 r + m - 1， 才能保证在 m 次失 
败之前出现第 r 次成功.这是因为，如果在 r + m - 1次试验之前或此时己经有 r 
次成功发生，那么在 m 次失败之前必然有 r 次成功，反之也成立.因此，利用公式 
(8.2), 所求概率为 


例 8 e (巴拿赫火柴问题）某个抽烟的数学家一直就随身带着两盒火柴，一盒放 
在左边口袋,另一盒放在右边口袋.每次他需要火柴时,都是随机地从两个口袋中任 
取一盒，并取出其中一根.假设开始时两盒中都是 iV 根火柴，问在他第一次发现其 
中有一个盒子已经空了的时候，另一盒中恰好有 fc 根火柴的概率有多大？ fc = 0,1， 
2,■•- , N . 

解••令 E 表示事件“数学家第一次发现右边口袋里的火柴盒是空的,而此时左 
边口袋里的火柴盒里还有 fc 根火柴”，这个事件发生当且仅当第 (N + 1 + N - k ) 
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次抽取根火柴时候正好取中的是右边口袋，而且是第 (^V + l ) 次取中右边口袋，因 
此，利用公式 （8_2)( p = l /2 ,r = AT + l，n = 2 iV -* + l )， 有 

另外，还有同样概率的事件是第一次发现左边口袋里的火柴盒是空的，而此时 
右边口袋火柴盒里恰好还有 fc 根火柴.而这两个事件又是互不相容的，因此所求概 
率为 

例 8 f 计算参数为 （ r ， p ) 的负二项随机变量的期望值和方差. 

解： 

= r -± n ^ y + Hi - P )- 因为 UK ) 

=-(m - I )*" 1 ( m ~ l ) p r+ \l - p ) m -( p+1 > 令》71 = 71+1 

P m=r+l 

= ^[(y-i) fc - 1 ] 

其中 y 是一个参数为 （ r + l ， p ) 的负二项随机变童.在上式中令 fc = 1，可以 
得到 r 

E[X] = p 

在上式中令 A = 2,并利用负二项分布的随机变量的期望的公式，可以得到 

因此， 




从例 8 f 可以 看出： 如果进行独立重复试验，每次成功的概率为 P , 则需要累积 
r 次成功的总试验次数的期望值和方差分别为 r / p 和 Kl - pVp 2 . 

由于几何随机变量就是参数 r = 1的负二项随机变量，由上面的例子可得参数 
为 p 的几何随机变量的方差为 (1- P )/ P 2 , 这样就验证了例 8 c 的结果. 

例 8 g 连续掷一枚骰子，一直到点数1出现了 4次，求投掷总次数的期望值 
和方差. 
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解： 因为我们所关心的随机变童 X ( 投掷总次数）服从负二项分布，参数 r = 4, 
P = 1/6. 因此 


E[X) = 24 
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4.8.3 超几何随机变置 

一个坛子里有 W 个球,其中 m 个白球 , AT - m 个黑球，随机地（无放回）从中 
取出大小为 n 的样本，令 X 表示取出来的白球数，那么 


.(T)r„ ： r) 

P{X = t } =- i = 0,1, ••- ,n (8.4) 

C) 


一个随机变量 X , 如果其概率分布由公式 (8.4) 给出，那么 X 就称为超几何 （ hype ^ 
rgeometirc ) 随机变量. 

注释虽然我们把超几何随机变量取值的概率从0写到了 n , 但事实上 P{X = 
i } 等于0,除非 i 满足 n-(N -m) min ( n , m ). 然而，式 (8.4) 一般来说是成 
立的，因为为了方便，我们规定了在 ife < 0或 r < Jfc 时，等于 0. ■ 

例 8 h 栖居于某地区的动物个数 TV 是未知的，为了得到对 7 V 的大致估计，生 
态学家们常常进行如下的试验.他们先在这个地区捕捉一些动物，比如说 m 个，然 
后标上记号放掉它们.过一段时间，当这些标有记号的动物充分散布到整个地区后, 
再捉一批，比如说 n 个.设 X 为第二批捉住的 n 个动物中标过记号的动物个数.如 
果假设两次捕捉期间动物的总数没有发生变化，而且捉住每一只动物的可能性是一 
样的，那么； f 为一超几何随机变童，满足 


o 


其中 i 为 X 的观测值.由于 Pi(N) 是这个地区事实上总共有 AT 个动物的条 
件下观测事件 X 取值的概率，故使 Pi(N) 达到最大值的 TV 值应当是动物总数 JV 
的合理的估计.这样的估计称为极大似然 （maximum likelihood ) 估计. 更多的这种 
估计的例子可参见理论习题13和理论习题 18. 

求 Pi(N) 最大值的最简单的方 法是： 首先注意到 
Pi(N) — (N- m)(N - n ) 

Pi(N - 1) = N(N -m-n + i ) 
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要使上述比值大于1,当且仅当 

(N — m)(N — n ) ^ N(N — m — n + i ) 

或等价地，当且仅当 mn 

N 

可见， Pi ( N ) 是先上升，然后下降，且在不_过 mn / i 的最大整数处达到其最大值. 
这个最大整数就是 JV 的极大似然估计.例如，假定第一次捕捉到了 m = 50只动物, 
标上记号后放掉.第二次又捕捉了 n = 40 只动物，其中标有记号的有 i = 4只，那 
么，我们就可估计出这地区大约有500只动物.（要注意上述估计还可以这样 求得： 
在这个地区内，标有记号的动物所占的比例为 m / N , 应当近似地等于第二次捕捉的 
动物中做过标记的动物所占的比例 t / n .) ■ 

例 8 i 某采购员购买一种10个一包的电子元件.从一包中随机地抽査3个， 
如果这3个元件都是好的，才买下这一包.假定含有4个残次元件的包数占30%, 
而其余70%每包只有一个残次元件.试问被这个采购员拒绝的包数占多大比例？ 
解： 设>1表示“采购员买下某一包”这一事件，则 
P { A ) = 这包有4个残次品） x ^ + />(涮这包有1个残次品） x & 

G)© 3 Q© 7 54 


从而,将有46%的包被采购员 拒绝. ■ 

从 W 个球（白球比例为 p = m / N ) 里， 无放回随机抽取 n 个球，那么取中的 
白球数为超几何随机变量.如果对于 n 来说, m 和 AT 很大的话，那么有放回和无 
放回抽球没什么差别.因为当 m 和 AT 很大时，不管前面抽了多少球，接下来的抽 
到的是白球的概率仍然近似等于 P . 也就是说，直觉认为，当 m 和 AT 相比 n 很大 
时, X 的分布列应该近似等于参数为 ( n , p ) 的二项随机变量的分 布列. 为了证明这 
个直觉，注意到如果 X 为一超几何随机变量,那么对 i < n , 有 


mv-7) 

o 


ml _ (N - m ) l _ (AT - n ) In ! 

(m — *)! i ! (AT — m — n + 1 )! (n — t )! N \ 




N-l 


m—*+l N—m N — m —1 
N — i +1 N—i N — i —1 


N - m -( n — i — l ) 
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其中，最后等式成立的条件是 p = m/iV 且 m 和 AT 相对 n 和 i 来说都很大. 

例 8j 试计算服从参数为 ( n , N , m ) 的超几何随机变量 X 的期望和方差. 

解： 

t=0 i=l 

利用恒等式 

•'(T)="*(?_-/) * "(X—' 1 ) 

可以得到 

=罘办+ d - c - j 1 ) ( n)/o 7 離+們 

i-o 

其中， y 是一个服从超几何分布的随机变量，其参数为因此， 
在上面的等式中令 * = 1，有 E [ X ) = nm / N , 换言之,如果从 7 V 个球（其中 m 个白 
球）中随机抽取 n 个，那么其中白球数的期望为 nm / N . 

在上面的式子中令 fc = 2 ,可以得到 

后一个等式用到了前面关于服从超几何分布的随机变量^的期望的计算结果 • 
又由 E [ X ] = nm / N , 我们可以推导出 

令 p == m / N , 且利用等式 



Var ( X ) — np[(i 


t - l ) p - (n - 1 )-^—+ 1 - np ] = np(l _ p)(l - ^ 3 ^) 


得到 
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注释例 8 j 已经指出,从 iV 个球（白球的比例为 p ) 里随机无放回抽取 n 个球， 
那么抽取到的白球数的期望为 np . 而且，当 iV 相对 n 很大（这样 （iV - n )/( N - l ) 
近似等于 1) 时，有 Var ( X )« np ( l - p ), 也就是说， E [ X ] 与有放回抽球情形下（此 
时白球数为参数为 （《, p ) 的二项随机变童）是一样的.而且，如果总的球数很大， 
那么 Var ( X ) 近似等于有放回的情形.当然，这正是我们之前的 猜测： 当坛子里的 
球数很大时，抽取的白球数近似具有二项随机变量的分布列. ■ 

4.8.4 < ( Zipf ) 分布 

一个随机变量称为服从(：分布(有时也称为 Zipf 分布)，如果其分布列如下： 

叩 “}=各 * = 1，2，". 

其中£» > 0为参数.因为概率之和必然等于1,因此有 

-_T 

c 分布的名字来源于以下函数 

C ⑷ =1+① • + ① • + ."+ ① • + … 

它是数学中熟知的黎曼 C 函数（起源于德国数学家 G . F . B . 黎曼). 

<分布曾被意大利经济学家 Pareto 用来描述某个给定国家的家庭收入的分布. 
然而，把这一分布运用到更广泛的各种不同的领域，从而推广其应用的是 G . K . Zipf , 
因此又叫 Zipf 分布. 

4.9 随机变量和的期望值 

随机变童的一个十分重要的性 质是： 诸随机变量之和的期望值等于它们的期 
望值的和.本节中我们将证明这个性质，不过我们对样本空间作一个限制，那就是 
样本空间 S 是有限或可数无限集合.当然，没有这个限制，随机变量还是具有这个 
重要性质的（在理论习题中将给出证明的纲 要). 我们作这样的限制，不但可使证明 
变得简要而且可使期望变得更加直观.因此，在本节中，我们将假定样本空间 S 为 
有限或可数无限集合. 

对于随机变量 X ，用 x ( s ) 表示当试验结果为 s e S 时随机变量的取值■当 
X,Y 是随机变量,则它们的和 z = 久 + y 也是随机变量，并且= X ( s ) + Y ( s ). 

例 9 a 设试验为抛掷一枚硬币共5次，此时试验结果是正面与反面的一个序 
列（长度为 5) .设 X 为前面三次抛掷得到正面向上的次数, Y 为后面两次抛掷所 
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得到的正面向上的次数.令 Z = X + y , 例如 ， S = ( h ， t , h ， t , h )^* h 表示正面向 
上, t 表示反面向上)， 


X ( s ) = 2 V ( s ) = 1 Z ( s ) = X («) + y («) = 3 

其意 义为： 结果 ( h , t ， h , t , h ) 中前 3 次抛掷得到 2 次正面向上，后2次抛掷得 
到1次正面向上，而 Z ( S ) 刚好是5次抛掷得到正面向上的总次数 （3 次). _ 

记 P 00 = P ({ s }) 表示试验结果 s 的概率.对于任何事件木可以写成有限个 
或可数无限个互不相容的事件之和，利用概率公理可知 

戶⑷= 1 Zp ( s ) 

•eA 

当 A = S 时上式变成 

1 = 5^ P ( S ) 

•es 

现在考虑随机变量 X 和它的期望 E [ X ). 由于 X 的取值为 X ( s ), 其中 S 为试验结 
果， E [ X ] 在直观上可以认为是 X ( a ) 的加权平均，其权值刚好是 s 出现的概率 p ⑷. 
现在证明这个直观的结论. 

命题 9.1 

E [ X ] = ^ X («) p ( fl ) 

*65 

证 明：设 X 的取值范围为叫 , i > 1. 对每一个 i , 令 S < 表示事件{叉 =；!：<} ，即 
Si = {s : X ( s ) = Xi}. 由期望的定义，通过一串等式就可以得到命题的结论， 

B [ x ] = ^ I i p{x = I i } 

= xiP ⑻ = Yl Xi Yl 
=亡 X] x *p( a ) = ^( 5 )p( 5 ) 

i a^Si i s€St 

= $>(*) 
aes 

其中第一个等式是随机变量期望的定义,最后的等式是样本空间 S 为诸不相容的 
事件负 ,s 2 , … 之并. _■ 

例 9 b 将一个硬币独立地抛掷两次，假定正面向上的概率为 P , 令 X 表示正 
面向上的次数.由于 

P(X = 0) = P { t , t ) = (1 - p ) 2 

P(X = 1) = P { h , t ) + P ( t , h ) = 2 p(l — p ) 

P(X = 2) = P ( h , h )= p i 
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由期望的定义知 


E [ X ] = 0 • (1 — p ) 2 + 1 • 2 p(l - p ) + 2 p 2 = 2 p 


而由命题 9.1 得到 


E [ X ]= X ( h , h ) p 2 + X { h , t ) p ( l - p ) + X ( t , h )( l - p)p + X ( t , i )( l - p ) 2 

= 2 p 2 + p(l — j >) + (1 — p)p + 0 = 2 p 


两种计算方法得到的结果相同. 

现在我们来证明关于随机变量和的期望的一个十分重要且有用的性质. 
推论 9.2 对于随机变量，…，下式成立 


E 



E 柳1 

i=l 


证明： 令 Z = 利用命题 9.1 得 


E[Z]='£z( 3 )p(a) 

»€S 

= 51 (^l(«) + 於⑷ + ••• + ^r.(«))p(«) 
aes 

= 51-^1 (*) p ( a ) + Yl Xi ( a ) p ( a ) + ••• + 5 Z x n (. a ) p ( s ) 

aes »es ses 

= £[X 1 ] + £[X a ] + --- + E[X„] 


例 9 c 设抛掷 n 颗均匀的骰子，求得到点数之总和的期望值. 

解••记 X 为得到点数之总和，利用下列； f 的表达式来计算 E [ X \： 


□ 


»=i 

其中足为第 i 颗敢子出现的点数.由于每颗敢子都是均匀的，得到 

6 

W = Ej '( 1 /6) = 21/6 = 7/2 
i=i 

这样， n 

E [ X ] = eKZ X< = S = 3 - 5n 

L>=1 J i=l 

例 9 d 现设一共有 n 个试验，其中第 i 次试验成功的概率为 恥 i = 1,2,… ，71. 
求成功次数的期望值. 
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f 1, 试验 i 成功 
1 0，试验 i 失败 


n 次试验成功次数 X 具有下面的表达式 




利用推论 9.2 得到 n n 

职]=亡£；[不]=^> 

«=1 «=i 

注意，这个结果不要求各次试验相互独立.而二项试验是 n 次独立重复试验，每次 
试验成功概率为 P< = P, 这是本例的一种特殊情况.因此，利用本例的结论可得， n 
次试验中成功次数的期望值为 np . 我们也可以将超几何随机变量进行分解.设坛 
子中一共有 W 个球,其中有 m 个白球.现在从坛子中无放回地抽取几个球.坛子 
中的任意一个球(^)都有相同的机会在第 i 次抽中，因此第 i 次抽取抽中白球 
的概率为 p = m / N , 尽管各次抽取互相不独立,但是无放回抽样还是符合本例的要 
求，抽得白球数的期望为 np = nm / N . ■ 

例 9 e 在例 9 d 中讨论了两种特别的情况，二项随机变童和超几何随机变量, 
试导出这两个随机变量的方差. 

解：令 A •表示 n 次试验中成功的次数（在超几何随机变童的情况，第 i 次取 
出白球视为该次试验成功).如上例所示， X 可以写成 X 我们得到 


£[X 2 ] = E 


㈣ (! 




S 十十 ㈣ 
亡寧? 1+亡 (91) 


|_»=1 *=1 jjti 

= Ep *+ EE e ^] 

* *=1 i*i 

上式中最后一个等式用到了 X ,? = .由于 Xi,Xj 只取0, 1两个值，我们得到 


从而 


XiXj = 


1 Xi = l,Xj = 1 
0其他 


E [ XiXj ] = P{Xi = l,Xj = 1}= 尸(第 i 次试验和 第：/ 次试验都成功) 
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当久是二项随机变量时，不与义彡相互独立，这样 
E[XiXj]=p 2 , ijij 

再利用 （9.1) 式，可得到 

E[X 2 ] =np + n(n — l)p 2 


从而 


Var ( X ) = E [ X 2 ) - ( E [ X ]) 2 = np + n ( n - l ) p 2 - n 2 p a = np(l - p ) 

当 X 是超几何随机变量的时候， P{Xi = l,Xi = l } 可以这样 求得： 在第 i 次 
取得白球情况下，第 j 次抽取时，剩下的 AT - 1个球具有相同的机会被抽取，而抽 
到白球的条件概率为 （m - 1)/(^-1).这样 

P{Xi = l,Xj = 1} = P{Xi = l } P{Xj = l|Xi = 1} = ^ • 

利用 （9.1) 式 (pi = m / N ) 可得 

nm , ,. m m — 1 

= + "<"- 1 > iv 5 vTT 

其方差为 

v# 等 + "("-1)^1-( 詈 ) 

如例 8 j —样，上式可化简为 

Var ( X ) = np(l - p ) (1 - 

其中 p = m/N ■ 

4.10 分布函数的性质 

回顾 X 的分布函数 F 之定义， F (6) 表示随机变量取值小于或等于 b 的概率. 
以下是一些有关分布函数的性质. 

1. F 是一个非降函数，也即，如果 a < 6,那么 F ⑷彡 F (6); 

2. fc lim F (6) = l ; 

3. lim F { b ) = 0; 

4. F 右连续的，也即，对于任 一 b 和一个递减且收敛于&的序列 1, 
有 Jim F (6 n ) = F ( b ). 

" ttkl 成立的原因是注意到在 4.1 节中已经指出，因为对 a < 6,事件 {X < a } 
包含在事件 {X < 6} 中，因此，前者的概率不可能比后 者大. 性质2, 3, 4成立都因 
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为概率的连续性 （2.6 节). 例如，为了证明性质2,注意到，如果递增到 oo , 那么 
事件序列 {X < 6 „},n > 1为递增事件列，它们的并为事件 {X < oo }. 因此，利用 
概率的连续性，有 n lim P { A -<6 n } = P{X < oo } = 1,这样，性质 2 就得到了证明. 

性质3的证明留作习题.为了证明性质4,注意到，如果递减到6,那 
么 {X < 6„}， n 多1,为递减事件序列，它们的交为 {X < <>}• 因此，根据概率的连续 
性，可得 Jim P { X < fc n } = P{X < 6}, 这样就证明了性质 4. 

所有有关 X 的概率都可以通过其分布函数 F 进行计算.例如 

P{a < X < 6} = F (6) - F ⑷ 对任意 a < 6 (10.1) 

将事件 {X < 6} 写成互不相容事件 {X < a } 和 {a < X < &} 的并也可以得到这 
点，即 {X < 6} = {X 彡 a } U {a < X < 6}, 因此， P{X < 6} = P{X < o } + P{a < 
X < 6}. 这样，公式 (10.1) 就成立了. 

如果要计算“ X 严格小于的概率，那么再次利用概率的连续性可以得到 
P{X < 6} = P f lim = Umpfx <6-- > )= lira 

\ n—»oo l n i J n—»oo 、 n J n—»oo y n ) 

注意 P{X < 6} 并不一 定等于 F ( b ), 因为定义 F ( b ) 亊件为 {x < 6} + {x = 6}. 

例 10 a 随机变量 A ■的概率分布函数 如下： 

0 i < 0 

x /2 0 < x < 1 

F ( x ) = 2/3 1 < i < 2 

11/12 2<*<3 
1 3 <z 

F ( x ) 的图像见图 4.8, 计算： 

( a ) P{X < 3}; ( b ) P{X = 1>; ( c ) P{X > 1/2}； ( d ) P {2 < X < 4}. 


fix) 



图 4.8 F(i) 的示意图 
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解: ( a ) P{X < 3} = ^ 3 - i } = ^(3 - =苕 

( b ) P{X = 1} = P{X < 1} - P{X < 1} 

= F ( i )-„ taF ( i - i ) = |-i = i 
(0 P { X >1} = 1- P { x « l } = l - F ( i ) = | 

⑷ / >{2<X<4} = F ⑷ -F(2) = ^ ■ 

小 结 

定义在试验结果上的实值函数称为随机变 f(random variable ). 

如果 X 是一随机变量，那么如下定义的函数 F ( x ) 

F { x ) = P{X < x ) 

称为随机变量久的分布函數 (distribution function ). 任意有关 X 的概率都可以通 
i ± F 进行计算. 

若一个随机变量的可能取值的集合是有限集，或者可数无限集，那么称该随机 
变童为离散型随机变量.如果久是一个离散型随机变量，那么函数 
p ( x ) = P{X = *} 

称为 X 的概率分布列或分布列.另外，如下定义的 BIX ] 

E [ X ]= ^2 xp ( x ) 

x:p(x)>0 

称为 X 的期望值 (expected value ), E [ X ] 通常也称为 X 的均值 （ mean ) 或期望 （ 
expectation ). 

设 〆 a :) 是一个实值函数，则对于离散型随机变童 X ,关于 E \ g { X )} 的一个有 
用的计算公 式为： 

五 [ffWl = 3(,x)p(x) 

x:p(x)>0 

随机变量 X 的方差 （ variance ), 记为 Var ( X ), 定义 如下： 

Var ( X ) = E [( X - B [ X ]) 2 ] 

方差等于 X 与它的期望的差的平方的期望，它度量了 X 可能取值的分散程 
度.下面是一个有用的恒等式 

Var ( X ) = E [ X 2 ] - { E [ X ]) 2 
y /~ Var ( X ) 琳为 X 的标准差 (standard deviation ). 
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本章中，我们介绍了一些常用的离散型随机变童. 

若随机变量 X 的分布列为 

pW = ⑺办-?)"—‘ * = 0 ，."，n 

则称为参数为 ( n , p ) 的二项随机变量.该随机变董可解释为 n 次独立重复试验 
中试验成功的次数,而每次试验成功的概率为 P . 它的均值和方差如下 
E [ X \ = np Var ( X ) = np(l — p ) 

若随机变量 A ： 的分布列为 

P -A\< 

p ( t ) = — Tj — t = 0,1, ••- 

则 X 称为参数为 A 的泊松随机变量.如果进行多次（近彳以）独立的试验，而且每次 
成功的概率都较小，那么总的成功次数就近似为泊松随机变 ft . 泊松随机变量的均 
值和方差都等于其参数 A ， 也即 E [ X } = Var ( X ) = A . 

若随机变量 X 的分布列为 

P(t) = PC 1 - P)* -1 i = 1,2,••- 

则 A " 称为参数为 P 的几何 ( geometric ) 随机 变量. 在独立重复试验序列中， 从开始 
直到第一次成功为止的试验次数就是几何随机变量，其分布参数 P 就是每次试验 
成功的概率.其均值和方差分别为 

E [ X ) = 1 - Var ( X ) = ^ 

若随机变量 X 的分布列为 

P(i) =(*I J)p r (l- P) i_r i = r,r + l, ■■- 

则 X 称为参数为 （ r , p ) 的 负二項 (negative binomial ) 随机 变量.在独立重复试验 
序列中，从开始直到第 r 次成功为止的试验次数就是负二项随机变量.分布列中的 
参数 p 就是每次试验成功的 概率. 其均值和方差分别为 
E [ X ] = r - Var ( X ) = ^^ 

设从一个装有 W 个球，其中 m 个白球的坛子里，随机抽取 n 个球，其中白球 
的数目就是参数为 ( n , N , m ) 的超几何随机变量.其分布列为 

( T )( w „： r ) 

p(*) = 


o 


t = 0,1, •• - ,m 
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其均值和方差分别为 

E [ X ] = np Var (^ f ) = :: ^ np(l - p ) 

其中 p = m / N . 

期望的一个重要性质是：随机变量和的期望等于它们的期望之和.即 

e [ e ^1 =ew 

L <=1 J i=l 

习 题 

1. 坛子里有8个白球，4个黑球, 2个橙色的球，随机从中抽取2个.假设抽取的球中每一个 
黑球能贏得2元,每个白球要输掉1元.令 X 表 示最后 贏得的数目，那么久的可能取值 
是哪些？取这些值的概率是多大？ 

2. 掷2枚均匀的骰子.令 X 等于2枚骰子的点数乘积，计算 P{X = i},i = l ,2, * _ ,36. 

3. 掷3枚败子.假定6 3 = 216种结果都是等可能的，记久表示3枚骰+的点数之和，计算 
X 取各可能值的概率. 

4. 5个男生和5个女生依照他们的测验成绩排名.假定没有两个学生的成绩是相同的，而且 
所有101种可能排名都是等可能的.令久表示成绩最高的女生在全体同学中的排名（比 
如 ，X = 1 表示第一名是女生).求 P{X = *>,*= 1,2,3, ••• ,8,9,10. 

5. 掷一枚硬币 n 次，令； f 表示得到的正面朝上数与反面朝上数之差 . X 的可能取值是哪 
些？ 

0. ^习题5中，如果硬币是均匀的，对于 n = 3,计算 X 的分布列. 

7. 掷一枚骰子2次，以下随机变童的可能取值是哪些？ 

( a ) 两次投掷出现的最 大值； （ b ) 两次投掷出现的最 小值； 

( c ) 两次投掷所出现的点数 之和； （ d ) 第--次投掷的值减去第二次投掷的值 • 

8. 习® 7中，假设《子是均匀的，计算 （ a ) 到 （ d ) 里各随机变量可能取值的概率. 

9. 在球是有放回的情形下重做例 lb . 

10. 在例 Id 中，计算在己知我们己经贏得钱的条件下，共贏得 i 元的条件概率 ， i = 1,2,3. 

11. ⑷从 {1,2, …,10 3 }中随机选--个数 K 且选中每个数的概率都一样.问 W 能被3整 

除的概率是多大？能被5整除呢？能被7整除呢？能被15整除呢？能被105整除 
呢？如果10 3 换成 10*, 并且 fc 越来越大，那么答案如何变化？ 

( b ) 数论里有默比乌斯函数 ix { n ), 它对所有正整数有定 义：当 n 具有重复的素数因子 
时，定义 / i ( n ) = 0. (例如，当 n = 12时，其素因子为2 x 2 X 3,当 n = 49时， 
n = 7 x 7 , 对于这些 n ,/ x ( n ) = 0 ■现设 W 为从 {1,2,•.• , 10*=} 中随机取的一个数, 
求 Jiim P {/ i ( N ) = 0}. 

提示： 计算 P { KN ) # 0}, 利用等式 



其中只是第 i 小的素数 （1 不是素数). 



12. 在“莫拉 ( Morra ) 二报”赌中，两赌徒各伸出1或2个手指，并同时猜对方伸出的手指数. 
如果两人中只有一人猜对了，那么他贏得两人伸出的手指数之和的钱（单 位： 元).如果两 
人都猜对了或都没猜对，則谁也不贏谁的钱.现考虑某指定赌徒，并设他在一局“莫拉二 
指”赌中贏得的钱数为； 

( a ) 如果两赌徒的行为是独立的，并且假设每-赌徒将伸几个手指以及他猜测对方伸几个 
手指总共4种情况是等可能的.试问久取哪些可能值？取这些值的概率各是多少？ 

( b ) 假定两赌徒的行为是独立的，而且每个人猜对方要伸几个手指就决定自己伸几个手 
指，且设每个赌徒伸1或2个手指是等可能的.试问 X 取哪些可能值？取这些值的 
概率各是多少？ 

13. 某销售员计划了两个销售会来推销百科全书.第一个销售会成交的概率为 0.3, 第二个销 
售会成交的概率为 0.6, 且相互独立.销售的百科全书有高级版，价值1000元，也有平装 
版，价值500元,销售任一种是等可能的.计算总的销售值 X 的分布列. 

14. 5个不同的数随机分派给1,2,3,4,5号共5个人.两人之间比较数的大小，大者获胜.最 
初，1号和2号比较,胜者再同3号比较，等等.令； f 表示1号在比较中获胜的次败.计 
算 P{X = t},i = 0, l ,2,3,4. 

15. 美国篮球联盟 ( NBA ) 选秀大会上包含有当年输贏记录最差的11支球队.总共有66个 
球放入坛子里，每个球都刻写了某个球队的名称.有11个写了最差球队的名称，有10个 
写了倒数第..球队的名称，有9个写了倒数第二球队的名称，……有1个写了倒数第11 
的球队的名称.从中随机抽取-球，其上面的球队获得第一轮选秀权， 它对 以在补充球员 
时具有优先的选 择权. 然后，再抽取一个球，如果它与第一次抽取的是不同的球队，那么 
该球队获得第二轮选秀权.（如果与第一次抽取的是相同的球队,那么放弃并重新抽球，直 
到抽取到不同的球队为止 .） 最后，再抽取-个球（假设抽取的球队与前两次不同)，其上球 
队获得第三轮选秀权.剩下的第4轮到第11轮选秀权按照剩下球队的输贏顺序颠倒过 
来分配，举例说，如果记录最差的球队没有获得前三轮选秀权，那么它将获得第四轮选秀 
权.令 X 表示最差球队获得的选秀权轮数，求 X 的分布列. 

16. 在习題15中，设1号球队为最差球队，2号球队为第二差球队， 等等令 V ；表示获得第 

i 轮选秀权的球队号码.因此，如果第一轮选秀权属于3号球队，那么 yi =3, 计算以下分 
布 列：⑷ (b) y a; (C) v 3 . 

it . 假设 x 的分布函数 如下： 

1 0 b <0 

6/4 0 < 6 < 1 

1/2+ (6-1)/4 1 <6<2 
11/12 2 < 6< 3 

1 3 彡 6 

( a ) if * P{X =«},* = 1,2, 3. ( b ) * p { i < X <|}. 

18. 独立重复投掷一枚均匀硬币4次，令； f 表示“正面朝上的数目”，画出随机变量 X -2 
的概率分布列. 
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19.设 X 的分布函数由下式 给出： 


m 


0 

6<0 

1/2 

0<6< 1 

3/5 

1<6<2 

4/5 

2<6<3 

9/10 

3 ^ 6 < 3.5 

1 

b 彡 3.5 


试求 x 的分布列. 

20. 一本关于赌博的书中建议了如下轮盘赌“必胜策略赌徒押“红”1元，如果结果是“红” 
(概率为 18/38), 那他♦走1元利润，并且离开.如果赌徒输掉了这1元（概率为 20/38), 
他应该在下面两次轮盘赌中，还押“红” 1元钱，赌完两次以后就离开，记 X 为这个人终 
止赌博时所贏的钱数， 

( a ) 求 P{X > 0}. ( b ) 您相信该策略 真是- 个“必胜策略”吗？给出您的解释. 

( c ) 求 E[X]. 

21. 总共4辆大客车载着148名同学从同-个学校到足球馆，车上分别有40,33,25和50名 
同学.随机抽取一名同学，令 X 表示该同学所在的车上的同学数.同时随机选一位司机， 
令 y 表示他驾驶的车上的同学败. 

( a ) 和 B [ y ] 哪个大？为什么？ （ b ) 计算和 E[Y]. 

22. 假设两个队进行一系列比赛，一直到其中有一队贏了 i 局，假设各局比赛胜负是相互独立 
的，并且4队获胜概率为 p ， 求出下列条件下比赛的局数的期 望值： 

⑷ < = 2. ( b ) i = 3. 

同时 指出： 在两种情形下，这个期望在 p = 1/2时达到最大. 

23. 假设你有1000元以及某商品，该商品当前价格是每盎司2元.假设一周后该商品的价格 
变成每盎司1元或者每盎司4元，两种情况的可能性是一样的. 

( a ) 如果你的目的是使得一周后的期里财产达到最大，你将采取什么策略？ 

( b ) 如果你的目标是使得你拥有该商品的期望数一周后达到最大，你又将采取什么策略？ 

24. A 和 B 进行如下 赌博： A 写下1或2中的一个数，而 B 要猜写的是哪一个，如果 A 写 
下的数是 i 且 B 猜对了，那么 B 从 A 那获得 i 元，如果 B 猜错了，那么 B 将付给 A 3/4 
元.如果 B 是随机地猜，猜1的概率为 p , 猜2的概率为1 - p , 计算 B 贏钱的期望，如果 
( a ) A 写的是1; ( b ) A 写的是 2. 

为使 B 的期望贏钱数的最小值达到最大， p 应该取什么值，并求出这个极大的极小值 .（B 
的期望贏钱数不仅依赖于 P 的值，还依赖于 A 的策略 .） 

现在考虑 A , 假设他也是随机地决定，写1的概率为 g , 那么 A 的期望损失是多大？如果 

( c ) B 猜的是1; ( d ) B 猜的是 2. 

当取什么值时,使得 A 的最大期望损失达到最小？指出 A 的最小的最大期望损失刚好 
等于 B 的最大的最小期望贏钱数.这个结果就是著名的极大极小定理，它是由数学家约 
翰.冯诺依曼建立的，它也是博弈论中的基本的数学结论.这个公共值称为博弈者 B 的 
博弈值. 



25. 抛掷两枚硬币，其中一枚在抛掷时正面朝上的概率为 0.6, 另一枚正面向上的概率为 0.7. 
假定两次抛掷是相互独立的，令 X 为两次抛掷时正面向上的次数 .（ a ) 求出 P{X = 1}; 
( b ) 求寧] • 

26. 一个人随机地从 {1,2, •• - ,10} 中选择一个数，然后让你猜这个数.通过向对方问若干次 
以“是”或“否”为答案的问题，你就可以根据推理确定这个数.计算下列策略情况下，需 
要提问次数的期望值. 

( a ) 第 i 个问題是 :“是 i 吗？ -,* = 1,2,3,4,5,6,7,8,9,10. 

( b ) 每一个问题都尽可能去掉剩下数字的一半 .® 

27. 保险公司开出的保险单规定，如果某个事件£在一年内发生了，那么保险公司必须付出 
一笔钱 A 如果保险公司估计亊件£在一年内发生的概率为他应该向顾客收多少保 
险费，他的期望收益才能达到4的10%? 

28. —个箱子里有20件产品，其中4件为残次品.从中随机取3件作为样品，计算样品中的 
残次品数量的期望值. 

29. 某个机器停止工作有两个可能原因，检査第一个可能原因需要花费元，经査如果确实 
是这个原因，那么还需要修理费用元才能修好机器.类似地，检査第二个可能原因需 
要花费元，如果确是这种原因需要修理费用为元.令 p 和1 - P 分别表示机器停止 
工作由第一种和第二种原因引起的概率.在 p , Ci , Ri,i = \, 2 满足何种条件下，我们先检 
査第一种原因再检査第二种原因比反过来的次序能使得机器正常工作所需要的花费的期 
望值小？ 

注意： 如果第一次检査发现不是预期原因，那么仍需检査第二种可能性. 

30. 某人掷一枚均匀硬币直到第-次出现反面朝上.如果反面朝上出现在第 n 次抛掷，他将 
贏得 2" 元，令 JV 表示他的贏利，指出 E [ X ] = +oc . 该问题就是圣彼得堡悖论. 

( a ) 你*意付出100万元玩一局这个游戏吗？ 

( b ) 如果每局付出100万，你可以一直玩下去，直到你想停止该游戏，你会玩吗？ 

31. 每天晚上，不同的气象工作者都将告诉我们明天下兩的概率.为了判断他们的预测水平， 
我们按如下方式给他们 评分： 如果某个人说明天下雨的概率为 P ， 那么他（她）的得分为 

fl -( l - p ) 2 如果第二天果然下雨 
\ l - p a 否则 

我们将 要在- 个时期内记录这个分数,并且推断平均分数最高者为巔好的天气预测者.现 
在假设某气象工作者也了解这点，他（她）当然想使得其期望分数最大化.如果他确信明 
天下雨的概率为 〆 ，那么他（她）应该给出怎样的 P 值才能使得期望分数最大化？ 

32. 100人要做血液检査，以便确定是否有某种疾病.然而，医院采用这样的 办法： 将100人 
分成10人一组，将10人的样本混在一起进行检査.如果检验结果为阴性，那么这一次测 
试对该组10人己经足够，若混合样本为阳性，那么还要对该组10个样本逐个进行检査， 
这样就共要检査11次.设每个人得病的概率为 0.1, 并且彼此相互独立.计算对每一个 
10人小组检査的平均次数（假定10人组内有_人得病，混合血样就会显示阳性) • 

①比如可以这样提问，第一个 问题: 这个数大于5吗？如果答案是,去捧了前面一半，如果回答否，去掉 
了后一半，然后继续重复类似的问题.一译者注 
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33. 某卖报小孩以10美分买进报纸并以15美分卖出，然而,不许他退还没有卖出的报纸.如 
果卖的报纸的需求量是参数为 n = 10 , p = 1/3的二项随机变量,给出他大约应该进多少 
报纸以达到期望收益的最大化. 

3 4 •在例 4 b 中，假设如果没有满足願客的要求（即顾客买商品时，商店缺货)，也会导致每单 
位商品增加一个额外的成本 c (这常常称为信誉成本，因为商店无法满足客户的要求)，计 
算该商店囤货 S 单位时其期望利润值，并且计算能使得期望利润最大化的 s 值. 

35. 盒子里有5个红弹子, 5个蓝弹子，随机从中取2个.如果颜色相同，那么贏得 1.10 元， 
如果颜色不同，将贏得 -1.00 元（也即输掉1元)，计算 

( a ) 贏得的期望值 .（ b ) 贏得的方差. 

36. 考虑习题22,其中 i = 2. 计算玩游戏局数的方差，并证明当 p = l /2 时,该值取得最大值. 

37. 计算习題21中 Var ( X ) 和 Var ( y ). 

38. 如果 E [ X ] = 1 及 Var ( A -) = 5,计算 
( a ) E [(2 + X ) 2 ). ( b ) Var (4 + 3 X ). 

39. 从一个装有3个白球3个黑球的坛子里随机地取球，然后放回，再取，一直进行下去.问 
最先取出的4个球当中，恰有2个是白球的槪率？ 

40. 次 考试有5道题目，同时每道题列出3个可能答案，其中有•个答案是正确的.某学生 
靠猜测能答对至少4道题的概率是多大？ 

41. 某人自称有超感官力.作为对他的考验，将一枚均匀的硬币抛10次，让他亊先预测抛得 
的结果，10次中他说对了 7次.如果他没有超感官力，他将作出至少这样好的答案的概率 
是多少？ 

42. 飞机在飞行中引擎出故陣的概率为 1- p , 且各引擎独立.如果飞机要半数以上引擎工作 
正常才能安全飞行，那么 p 为多大值时，5个引擎的飞机要优于3个引擎的飞机？ 

43. 某通讯系统传送数字0与1,但由于 ft 电千扰，传送的数字被错误地接受的概率为 0.2 .假 
定我们要传送一个由0和1组成的重要电报，为减少出错的机会，我们用00000代替0, 
用 mir 代替 1. 如果收讯者用过半译码法（即收到一半以上为0则译码为0, —半以上 
为1则译码为 1), 那么被传送的每个信息译出后是错误的概率有多大？此处作了何种独 
立性假设？ 

44. 某卫星系统由 n 个元件组成，在某天内如果至少 fc 个元件工作正常，那么卫星工作正常. 
某下雨天，每个元件失效的概率都为 Pl , 且相互独立.而天晴时每个元件失效的概率为 
pa , 也相互独立.如果明天下雨的概率为 a , 那么明天卫星仍正常工作的概率是多大？ 

45. 某学生己准备好参加一次重要的 U 试,且对口试那天他将处于怎样的精神状态很关心.因 
为他估计，如果他处于最佳状态，则其主考人各自独立地给他及格的概率为 0 . 8 , 若他处于 
很坏的状态，上述概率降到 0.4. 若假定有过半数主考人给他及格，他的口试才算合格，且 
这个学生己感到他处于很坏的状态的可能性比处于最佳状态的可能性大—倍，问他是邀 
请5位主考人还是3位主考人为好？ 

46. 假定某12个人组成的陪审团至少有9票有罪票才能判决一被告有罪，并设陪审员对有罪 
人投无罪栗的概率为 0 . 2 , 而对无罪人投有罪票的概率为 0 . 1 , 如果各陪审员的行为相互独 
立，且65%的被告是事实上有罪的.试求此陪审团作出正确判决的概率.被告中被判为有 
罪的占多大百分比？ 



47. 某些军事法庭常任命 9 名法官，原告与被告的律师都有权拒绝任何法官出庭,被拒绝的法 
官即离庭且不再找人替换.如果过半数法官投有罪栗，则被告被宣判有罪，否则，他就被判 
为无罪.假设对一个亊实上有罪的被告，各法官（独立地）投有罪票的概率为 0.7, 而对事 
实上无罪的被告，这个概率下降到 0.3. 

( a ) 当出庭法官数如下时，一个有罪的被告被判为有罪的概率是多少？ 

⑴9; ㈤ 8; ( iii ) 7. 

( b ) 对一个无罪的被告重做 （ a ). 

( c ) 假定原吿律师不行使拒绝法官出庭的权利，并限定被告律师至多可拒绝两名法官，如 
果被告律师有60%的把握判断他的当事人亊实上是有罪的，那么他拒绝几名法官为 
好？ 

48. 已知某公司生产的磁盘为残次品的概率为 0.01, 且相互独立.该公司按包出售磁盘，每包 
10张，并且作出 保证： 每包里最多有一个残次品磁盘，否则予以退货处理.如果某人买了 
3包，问正好要退货1包的概率是多大？ 

49. 当掷硬币1时，正面朝上的概率为 0.4; 当掷硬币2时，正面朝上的概率为 0.7. 随机选- 
枚硬币掷10 次： 

( a ) 10次投掷中，正好有7次正面朝上的概率是多大？ 

( b ) 在第-次投掷为正面朝上的条件下，在 1 U 次投掷中正好有7次正面朝上的条件概率 
是多大？ 

50. 假设掷--枚不均匀硬币，面朝上的概率为 p , 连续掷10次，已知一共6次正面朝上，求 
以下事件的条件 概率： 

( a ) 前三次为 H , T , T (意味着第一次为正面朝上，第二次为反面朝上，第三次为反面朝 上)； 

( b ) 前三次为 T . H . T . 

51. 某本杂志的一页上的印刷错误的个数的期望为 0.2, 那么下一页的印刷错误数为 （ a ) 0, ( b ) 
2的概率是多大？解释理由. 

52. 全世界每个月商业飞机发生坠毁亊故的平均值为 3.5, 以下亊件的概率是多大？ 

( a ) 下个月至少有2起坠毁亊故. （ b ) 下个月至多1次坠毁亊故. 

试解释原因. 

53. 去年纽约州大概举行80 000次婚礼.估计如下概 率值： 

( a ) 至少有一对夫妇他们都出生于4月30日， （ b ) 至少有一对夫妇生日相同. 

说明你做的假设. 

54. 某高速公路上每周丢弃车辆的平均值为 2.2, 求以下亊件概率的近 似值： 

( a ) 下一周没有丢弃 车辆； （ b ) 下一周至少丢弃两辆车. 

55. 某打字社雇了两名打字员.第一个打字员打宇时，每篇文章出错的平均数目为3,而第二 
个打字员每篇文章出错的平均数目为 4.2. 如果你的文章等可能地分配给这两个人，近似 
估计没有出错的概率. 

56. 至少*要多少人，这样其中至少有一人与你生日相同的概率超过1/2? 

57. 假设某高速公路上每天事故数是一参数为 A = 3的泊松随机变量， 

( a ) 求今天至少发生3件事故的 概率； 

( b ) 在今天至少发生了一件事故的假定条件下，重做 （ a ). 
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58. 在下列情形下，比较泊松近似和二项随机变量的 概率： 

( a ) P{X = 2}, 其中 n = 8 ,p = 0.1; ( b ) P{X = 9}, 其中 n = 10 ,p = 0.95; 

( c ) P{X = 0>, 其中 n = 10 ,p = 0.1; ( d ) P{X = 4}, 其中 n = 9 ，p = 0.2. 

59. 如果你买了 50 张彩票，每张中彩的机会为1/100,问你将有以下中彩数的（近似）概率是 
多少？ 

( a ) 至少1 张； （ b ) 正好1 张； （ c ) 至少2张. 

60. 给定一 年内，人患感冒的次数为参数为 A = 5的泊松随机变置.假设有种新药物（基于大 
量维生素 C ) 经过市场验证，对75%的人有效，并能将泊松分布的参数减少为 A = 3,对 
另外25%的人不起作用.如果某个人服用了该药，一年内患了 2次感冒，那么该药对他 
(她）有效的可能性是多大？ 

61. 一手牌分到福尔豪斯的概率约为 0.0014, 如果你玩1000手牌，求至少有2手福尔豪斯的 
近似概率. 

62. 考虑 n 次相互独立的试验，每次试验有 fc 个可能结果，其相应的概率为 pi , - - , P *， E ? =1 
P< = 1. 若所 有的朽 都比较小，指出 n 个试验中，没有两个试验结果相同的概率近似地 
等于 exp {- n ( n - l ) E ? =1 P ?/2}- 

63. 进入某赌场的速度为每两分钟一人， 试问： 

⑷在12:00至12:05之间没有人进入赌场的概率是多大？ 

( b ) 在这段时间内，至少有4人进入赌场的概率是多大？ 

64. 某州每个月的自杀率为毎100 000个居民中有…个自杀. 

( a ) 该州的一个拥有400 000居民的城市，在给定月份内至少有8名自杀者的概率是多 
大？ 

( b ) —年内至少有两个月，每月至少有8名自杀者的概率是多大？ 

( c ) 记当前的月份为1,第-次超过8名自杀者的月份为 <,0 1 的概率是多大？ 

你作了哪些假设？ 

65. 某军营有500 士兵，每人得某种疾病的概率为 1/10 3 , 且相互独立.为了方便，将500份 
血样混在-•起进行检测. 

( a ) 求混合的血液呈阳性的近似概率（这样至少有一名士兵患有此疾病). 

现假定血液呈阳性. 

( b ) 这种情况下，多于1人患此疾病的概率有多大？ 

再设其中一人琼斯知道自己患有该疾病- 

( c ) 琼斯认为多于1人患此病的概率有多大？ 

由于混合样本为阳性，医生决定每一个人都要测试.前面 i - 1个人为阴性，第 i 人为琼 
斯，检査为阳性. 

( d ) 作为 i 的函数， i 后面有人患此病的概率是多大？ 

66. 由 n 对夫妇组成的 2 n 个人随机（任何一种顺序都是等可能的）坐在一张圆桌上.记 G 
为“第 i 对夫赛坐在一起 ”， i = 1，…， n . 

⑷求 P ( Ci ). ( b ) 对 j # i ， 求 P{Cj\Ci). 

( c ) 当 r » 很大时，近似计算没有一对夫妻坐在—起的概率- 
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67. 重复计算上面的问題，如果要求男女间隔坐. 

68. 为了对付10枚导弹的袭击，发射了 500枚拦截导弹.拦截导弹随机地选择导弹作为目标， 
而且是等可能的.如果拦截导弹命中目标的概率是0.1，且相互独立，利用泊松范例近似 
计算所有导弹被成功拦截的概率. 

69. 掷一枚均匀硬币10次,用以下方法计算存在一个长度为4的正面朝上序列的 概率： 

( a ) 利用课文中导出的 公式； （ b ) 利用课文中导出的递推 公式； 

( c ) 与用泊松近似得到的结果进行对比. 

70. 在时刻0时投掷一枚正面朝上概率为 p 的硬币，设它落地后也正面朝上.根据参数为入 
的泊松过程选定时刻捡起硬币并抛掷（两次抛掷之间硬币就放在地上).那么在时刻 t 硬 
币为正面朝上的槪率是多大？ 

提示： 到时刻 t 没有额外的投掷的条件下，其条件概率是多大？如果有额外投掷，其条件 
概率又是多大？ 

71. 考虑轮盘赌中的-个轮盘，有38个数字——从1到36还有0以及 00. 如果史密斯经 
常押注在1到12之间，试求以下 概率： 

( a ) 史密斯将要输掉开始的5 局； （ b ) 他第一次贏钱将是第4次 下注. 

72. 两个球队进行一系列比赛，先贏得4场比赛的球队获得最终胜利.假设其中一球队的水 
平比另 •球队 稍强，其贏得每一场胜利的概率为 0 . 6 , 且各场的胜负相互独立.求强队获 
得最终胜利时比赛的场败为 i 的概率 ， i = 4,5,6, 7. 并与在3局两胜的比赛中获胜的概 
率进行比较. 

73. 考虑习题72,如果两队势均力敌，每场比赛每队获胜的概率为1/2,计算比赛结束时比赛 
场数的期望值. 

74. 某记者有一份要采访的人的名单，假设该记者需要采访5人，且任一个人（独立地）同意 
被采访的概率为 2/3. 那么名单上的人数为 ( a )5 人 ( b )8 人时，他能达到采访人数要求的 
概率为多大？ 

对于 （ b ) 来说，该记者采访到其名单上的 ( c )6 人 ( d )7 人时才刚好达到采访人数要求的概 
率为多大？ 

75. 连续掷一枚均匀硬币，直到出现第10次正面朝上为止•令 X 表示反面朝上出现的次数， 
计算 X 的分布列. 

70. 求解以下情形的巴拿赫火柴问题（例 8 e ): 在开始时左边的火柴盒有；^根火柴，右边的 
火柴盒有的根火柴. 

77. 在巴拿赫火柴问題中，求以下亊件 概率： 第一个盒子取空时（这个时刻与发现盒子为空盒 
的时刻是不-样的!)，另一个盒子还有 fc 根火柴 • 

78. 坛子里有4个白球，4个黑球，随机从中抽取4个球，如果 2 黑2白，那么停止抽球.否 
则，将这些球放回再次抽取4个,直到抽取的4个球中正好有2个白球，那么此时我们正 
好做了 n 次抽取的概率是多大？ 

79. 假设一批100个零件中有6个残次品，其他 M 个是合格品.如果随机从中抽取10个, 
记 X 为其中“残次品数”，求 （ a ) P{X = 0},( b ) P{X > 2}. 

80. 流行于内华达州赌场的一种赌博叫“凯诺”，其赌法 如下： 赌场从1至80号中随机地取出 
20个号码，赌徒再从这80个号码中任取1至15个号码.如果赌徒取出的号码中有一定 
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比例个数的号码与赌场所取出的号码相同，则他取胜,贏得的钱数是赌徒取号码的个数与 
其中配上对的号码个数的函数.例如，醣徒只取一个号码时，若此号码在赌场所取的20 
个号码中，则他每下注1元赌注贏 2.2 元. （由于此时赌徒的获胜概率为1/4,所以公平的 
贏得钱数显然应是每1元赌注贏3元 .） 当赌徒取出2个号码时，若这2个号码都在赌场 
所取的20个号码之中，则每下1元赌注1[得12元. 

(a) 此时公平的贏钱数应是多少？ 

令表示赌徒取出 n 个号码之中恰有 fc 个在赌场取出的20个号码之中的概率. 

(b) 求出 P n , k . 

(c) 在凯诺赌中，最典型的赌法是赌徒取10个号码，这种情况下赌场付出的钱数如下表. 
试计算期望贏得的钱数. 


押注10个号码贏得钱数 


猜对个数 

每一元赌注贏得钱数 

0~4 

-1 

5 

1 

6 

17 

7 

179 

8 

1299 

9 

2599 

10 

24 999 


81. 在例 8i, 具有 i 个残次品的包被拒绝的概率有多大？计算 i = 1及 i = 4时的拒绝概率. 
如果己 知一个 包被拒绝了，那么这个包含有4个残次品的条件概率是多大？ 

82. 购买者按包购买某晶体管，一包20个,其购买方式 如下： 随机检査该包里4个，如果4个 
全是合格品，那么接受这包，否则就祀绝.如果每包里的零件是否为残次品是相互独立的， 
且概率为0.1，那么拒绝的包数的比例是多大？ 

83. 一个省里有3条髙速公路，每天在高速公路上发生的亊故数是泊松随机变量，其参数分别 
为 0.3, 0.5 和 0.7. 找出今天在高速公路上发生亊故总数的期望值. 

84. 有10 t 球要放到5个盒子中去.每个球都是独立地被放入盒子中，而放入第 i 个盒子的 
概率都 

(a) 当10个球放完以后，5个盒子中可能有些盒子仍然是空的.求空盒子数的期望值. 

(b) 当10个球都放入盒子中去以后，求只含1个球的盒子数的期望值. 

85. —共有 fc 种优惠券，每收集到一张优惠券时，这张优惠券是第 i 种优惠券的概率为 p<, 

= 1 - 各次收集是相互独立的，现在假定已经收集到 n 张优惠券，问收集到优惠 
券的种类数的期望值是多少？ 


理论习题 


1.韦 N 种不同的优惠券，每次收集的种类都是相互独立的，而且收集到第 i 种的概率为 
p it i = 令 r 表示某人为了每个种类至少收集到一张需要的总张数，计算 



P{T = n }. 

提示： 利用类似例 le 的方法. 

2. 如果 X 的分布函数为 F ， 那么的分布函数是什么？ 

3. 如果的分布函数为 F , 那么随机变量 aX + 0 的分布函数是什么？其中是常数， 
a ^ O . 

4. 对取值为非负整数的随机变量 AT , 证明 

»=i 

提示： E~1 P{N > i } = Er = i P{N = k }. 然后交换求和次序 • 

5. 对一个取值非负整数的随机变量 AT , 证明 

f ； <P{JV><} = i(£ ： [JV a ]-£ ： [An). 

<-0 

提示： ESo *^ >0 = Ei = 0 iEr = i + i P{N = k ), 然后交换求和次序. 

8. 设 A •满足 

P{X = l }= p=l - P{X = —1} 

求 c,c / 1,使得 E [(^\ = 1. 

7.设 A ■为-•随机变童，期望值为叫方差为 < r 2 . 求以下随机变童的期望和 方差： 


8. 设 A •满足 

求 Var ( X ). 

9. 利用二项概率 

P{X = *} = ^ " J p^l - p ) n ~*, t = 0,"•• ,n 

导出二项展开公式 

(,：+»)" = x：( 

•=o \ 

其中 a :，》 为非负数. 提示： 令 p = 

10 . 设 A ： 为服从参数为 （ r », p ) 的二项分布的随机变童， 证明： 

E [ xTi \ = 1_ (n + i P )p + 

11. 考虑 n 重独立重复试验，每次成功的概率为 p . 证明 fc 次成功, n - k 次失败的共 n !/[ fcl ( n - 
fc )!] 种可能排列方式都是等可能的. 

12. n 个元件排成一排，每个元件工作正常的概率为 p , 且各元件相互独立.问没有两个相邻 
的元件都工作不正常的概率是多大？ 

提示： 以工作不正常的元件的个数作为条件，利用第1章例 4 c 的结果. 



P(X = o ) = p = 1 - P(X = b ) 
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13. X 为服从参数为 ( n , p ) 的二项分布的随机变童， P 取何值时能使 P{X = k } 取最大值？ 
fc = 0, l , - - , n . 这是关于一个统计方法的例子，是当观察到 X = 时，估计未知参数 p 
的一种统计方法.如果我们假定 T * 已知,通过选择使得 P{X = k } 最大来估计 p , 这就是 
所谓的极大似然估计方法. 

14. —个 家庭有 n 个孩子的概率为 op n ,n > 1,其中 q < (1 - p )/ p . 

( a ) 没有孩子的家庭的比例是多大？ 

( b ) 如果孩子是男孩或女孩的概率相等，且各孩子的性别是相互独立的. 那么有 k 个男孩 
(可能还有若干女孩）的家庭比例是多大7 

16. 考虑 n 次独立重复投掷一枚硬币，每次正面朝上的概率为 p . 证明有偶数个正面朝上的概 
率为 [1 + (9 - p ) n ]/2, 其中 9 = 1 - p . 此题，要先证明再利用如下 等式： 

E ( S ) pV_a ‘ = |[(P + 9)" + (9- P ) n ] 

其中 [ n /2] 是不超过 r »/2 的最大整数.将本题与第3章的理论习题16进行比较. 

16.令 X 为服从参数为 A 的泊松分布的随机变*,证明 P { X = i ] 随着 i 的增加，先是单调 
递增.然后再单调递减，当 i 取值为不超过 A 的最大整数时，它取得最大值. 

提示： 考虑 P{X = i }/ P{X = i - l >. 

17•令 X 为服从参数为 A 的泊松分布的随机变量. 

( a ) 证明： 

为偶数 } = |[l + e -2 入] 

利用理论习题15的结果以及泊松分布和二项分布之间的关系证明. 

( b ) 直接利用 e - A + e A 的展开式来证明上述等式. 

18. 令 X 为服从参数为 A 的泊松分布的随机变童，取何值时 P{X = k ] 取最大值 （ fc 彡 0). 

19. 如果 X 为服从参数为 A 的泊松分布的随机变量，证明 

E [ X ") = A£；[(X + l ) n - 1 ] 

利用该结果计算 £[ X 3 ]. 

20. 考虑 n 枚硬币，每枚硬币正面朝上的概率都是 P , 且相互独立.假设 n 较大，而 P 较小， 
令 A = r » p . 假设将这 n 枚硬币--起抛掷，-直到至少有 • 枚 硬币正面朝上为止，否则继 
续掷这 n 枚硬币.也即，停下来的时候至少有-枚硬币正面朝上•令 X 表示停下来时正 
面朝上的出现的总枚数.下列关于 P{X = 1} 的近似计算的理由哪个是正确的？所有情 
形中， y 都是-个服从参数为 A 的泊松随机变量. 

( a ) 因为掷 n 枚硬币时，正面朝上出现的次数近似于服从参数为 A 的泊松分布，因此 

P{X = 1} « P{Y = 1} = Ae- A 

( b ) 因为掷 n 枚硬币时，正面朝上出现的次数近似于®从参数为 A 的泊松分布，而且此 
数为正时才会停止，因此 

P{X = 1}« P{Y = l\Y > 0} = 
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( c ) 因为至少出现一枚正面朝上，当其他 n - 1枚都不是正面朝上时 X = 1.又因 n - 1 
枚硬币出现的正面朝上的枚数近似服从参数为 （ n _ l ) p »_\ 的泊松分布，因此 

P{X = 1} w P{Y = 0} = e~ x 

21. 随机抽取了 ri 人，令表示事件“第 i 人和第 j 人 生日相同”，假定一个人的生日在 
365天任一天的可能性是一样的. 计算： 

(a) P(£3.4|Bi . a )； (b) P(f? J , 3 |Ei. 3 ); (c) P(E a .3|£l. 2 n£i,3). 

^ Q ) 个亊件的独立性,你从上能得出什么结论？ 

22. 坛子里有 2 n 个球，其中两个标号1,两个标号2,…，两个标号 n . 每次无放回地随机从 
中取出2个，令: T 表示取出来的两个球第一次同号时的取球次数，（如果根本没有出现过 
两球同号，那么= 00), 对0 < a < 1,我们要证明 

Jim o P { T > an } = e _o/3 

为了证明这点，令 Aft 表示在前 fc 次取球后取出来的号码相同的球对数 ， fc = If , n . 

( a ) 说明当 r » 很大时，可认为是 fc 次（近似）独立重复试验中试验成功的次数. 

( b ) 当 n 很大时，求 P { M k = 0} 的近似值. 

( C ) 利用随机变童 Af * 的值表示亊件{了 > on }. 

( d ) 给出 P{T > an } 的公式，求极限概率. 

23. 考虑有 n 个人 （ n 至少取值在 80 - 90 之间)，在近似计算没有3个人同一天生日的概率 
时，一个比在文中得到的要好的泊松近似如下：令^表示亊件“至少有3人生日在第 i 
天”， * = 1，… ,365. 

⑷计算尸(玖) ； （ b ) 给出没有3人同一天生日的概率的近 似值； 

( c ) 当 n = 88( 可以证明 n = 88 为使得概率超过 1 / 2 的最小 n 的值）时，计算上述概率. 

24. 连续掷 ri 枚硬币，每次正面朝上的概率为 p . 考虑亊件“试验序列中出现连续 fc 次正面朝 
上”的概率以下是计算这个概率的另一个方法. 

( a ) 证明，对于 fc < n , 在试驗序列中出现连续的*次正面朝上的充要条 件是： 

( i ) 在前面 n -1 次掷硬币试驗结果序列中，己经出现连续的 fc 次正面向上的子序 
列，或者 

( ii ) 在前面 n - fc - 1次掷硬币的试验结果序列中，没有出现连续 fc 次正面朝上的 f 
序列，但第 r »- fc 次掷硬币时正面朝下，第 n-fc + 1,...， ri 次都是正面向上. 

( b ) 利用 （ a ) 建立与 Pn-l 的递推 关系. 从 ft = P * 开始,利用该递推公式可得 Pk+u 
然后 A +2 , 等等，直到 P „. 

25. 假设在某个时间内亊件发生的次数为参数为 A 的泊松随机变量.如果每个事件被统计到 
的概率为 P , 且各个事件是否被统计是相互独立的，指出被统计到的事件的数目为参数为 
Ap 的泊松随机变量，并给出一个直观解释.作为上述理论的应用，假设某个地区的铀的矿 
点数为参数为 A = 10的泊松随机变 S . 如果，给定一个时间段内，每个矿点被发现的概 
率为1/50,且相互独立.求以下事件的 概率： 

( a ) 这段时间内正好发现1个 矿点； （ b ) 这段时间内至少发现1个 矿点； 
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( c ) 这段时间内最多发现1个矿点. 

26. 证明： „ 

提示： 利用分部积分. 

27. 如果 X 为一几何随机变 ft , 给出分析的 证明： 


P{X = n + Jfc | X > n > = P{X = k ) 


利用几何随机变量的定义直观地说明上式成立的原因. 

28.令 X 为参数为 （ r , P ) 的负二项随机变量，令 y 为参数为 （ r », p ) 的二项随机变量，指出 


P{X > n } = P{Y < r > 


提示： 可以有两种方法完成证明.一种用分析的方法，上式等价于下列恒等式 




另一种是利用随机变量的概率解释.即考虑进行一系列成功率均为 p 的独立试验，用试 
验结果表示亊件 {X > n } 和 {y < r }. 

29. 设 X 为一 超几何随机变量，计算 P{X = k + 1}/ P{X = k }. 

30. 坛子里装有标有号码 1 到 Af 的球.假设随机无放回地抽取 n 个球， n 矣尺 . 令 Y 表示 
抽取的球中最大号码. 


( a ) 求 y 的分布列. 

⑻导出 E [ Y ] 的表达式,然后利用费马组合恒等式（参见第1章理论习题 11) 予以简化. 

31. 坛子里有 m + n 个芯片，分别标有号码1,2, ••• ,n + m . 从中取出 ri 个.如 果令久 表示 
抽取的芯片中，其号码大于留在坛子中芯片的最大号码的数量，求 X 的分布列. 

32. 坛子里有 n 个芯片.某男孩连续有放回地随机从中抽取，一直进行下去，直到他取出一个 
前面曾经取出过的芯片为止•令 X 表示此时的抽取次数，计算其分布列. 


S 3. 利用 (7.5) 式推导 (7.6) 式. 


34.从一 n 个元素的集合里，随机选择-个非空子集.假定所有的非空子集被选中的可能性 
是一样的.令 X 表示选中的子集的元索的个数.利用第1章理论习题12给出的恒等式， 
证明 


E [ X ) = 



Var ( X ) 


n -2 an - a - n ( n + l )2 n - 3 
(2" - l) 2 


证明，当 n 很大时， 

Var ( X ) ~ — 

上式的意义是当 n oo 时 Var ( x )/( n /4) - 1. 比较这个结果与 Var ( y ), 其中 Y 是离散 

集{1，…， n } 上的均匀随机变量，即= 0 = 1/ n , i = 1,…，队 
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35. 坛子里最初有一个红球，一个 K 球.每次随机取一个球，将该球放回坛子的同时还放进另 
一个同颜色的球.令 X 表示第一次抽取到蓝色的球时所抽取的次数.比如，如果第一次 
♦出了红球，第二次拿出的是蓝球，那么 X =2. 

( a ) 求 > 1. 

( b ) 证明，最终能取出 篮球的 概率为 1. (也即，证明 P{X < oo } = l .) ( c ) 计算 E [ X }. 

36. 设 X 的取值范围为 { x ,}, Y 的取值范围为 { Vi },Z = X + Y 的取值范围为{办}.记 A * 
为满足 Xi+yj = Zk 的措标 ( t , j ) 的集合，即 A * = {( i , j ) : Xi + y , = zi ,}- 

( a ) 证明 

p { x +y = zk ] = 5 Z =x ^y = Vj ) 

( b ) 证明 

+ y ] = 1 Z (** + Vi ) P{X = xt,Y = yj } 

* (* J )€4* 

( C ) 利用 （ b ) 中的公式证明 

E[X + Y] = Y, E(** + Vi) p i x = ^y = vi} 

i i 

( d ) 证明 

P(X = * i ) = 5 Z P i X = X *> Y = Vi ) 

P(Y = Vi ) = Yl p {X = Xi,Y = y >} 

( e ) 证明 

e[x + y ] = e [ x \ + £[ y ) 

自检习题 

1. 考虑某个棒球运动员在他接下来的 3 次击打中所获得的分数，令 A " 表示此随机变童 ，； f 
的可能取值为0, 1, 2, 3,如果 P{X = 1} = 0.3, P{X = 2 } = 0. 2 ,且 P{X = 0} = 
3 P{X = 3}, 求 E [ X \. 

2. 假设 X 的取值为0,1,2之一,如果对某个常败 c , 有 P{X = *} = cP{X = »-1},*=1,2, 
求 £[ X ]. 

3. 投掷一枚硬币，每次正面朝上的概率为 P , 连续投掷直到正面或反面朝上出现两次，求投 
掷总次数的期望. 

4. 某个社区由 m 个家庭组成，其中有 i 个孩子的家庭有 n < 个： Er = i«i = ^- 随机挑选一 
个家庭，令久表示该家庭的孩子数.再随机从个孩子中随机挑选一个孩子，令 
Y 表示该孩子所在的家庭里的孩子数， 证明： E [ Y ]^ E [ X ). 

5. 假设 P{X = 0> = 1 - P{X = 1}. 如果 C [ A -] = 3 Var ( X )， 求 P{X = 0}. 
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6. 箱子里有两枚硬币.抛掷其中一枚硬币，正面朝上的概率为 0.6. 抛掷另一枚硬币，正面 
朝上的概率为 0.3. 随机地从箱子中拿出一枚硬币并抛掷，在不知道拿的是哪一枚硬币的 
情况下，你可以押至多10元 的注： 如果是正面朝上，你将贏得你押的 数量； 如果是反面朝 
上,你就输掉押注.然而，假设有一位内幕人，他想卖给你信息，告诉你到底是选中了哪枚 
硬币，这个信息卖 C 元. 如果你买了这个信息,你的期望回报是多少？注意到如果你买了 
它，然后押注 a : 元,那么最后你可能贏得元，或 - sc - C 元（即你输掉 a : + C 元)， 
那么应该为这条信息支付多少呢？ 

7. 一个慈善家在一张红纸上写了一个 数宇; E , 给一个公证人看后，把纸片翻过来放在桌子上. 
公证人然后拥一枚均匀的硬币，如果是正面朝上，他在一 张葳纸 上写下 2: r , 如果是反面朝 
上，写下*/2,然后将纸也翻过来放在桌子上.在不知道 rc 的值，也不知道掷硬币的结果 
的情况下，你可以选择翻开红纸还是翻开篮纸.看了翻开纸上的数值后，你可以决定是要 
这张翻开的纸上写的数值作为奖励，还是要另外一张纸上写的数值（此时不知道大小）作 
为奖励.比如，如果你决定翻开藍纸，看了数值为100,这时你可以选择100作为你的奖 
励，也可以选择红纸上的数值 （50 或 200) 作为奖励.设想你希望奖励的期望值最大. 

( a ) 指出没有理由先翻开红纸，因为如果这样做的话，那么不管红纸上的值是多大，最好 
还应该再翻开 K 纸； 

( b ) 令 y 为一个固定的非负数，考虑如下 策略： 翻开蓝纸，如果上面的数值至少是 V ,那么 
就接受这个 奖励； 如果比1/小，那么再翻开红纸.如果慈善家写的是 a :, 令表 
示你执行该策略最后获得的奖励数，计算 ElRyix )]. 注意到 £[^(2；)] 是慈善家写的 
是 a ：, 而你执行“始终选择蓝纸”这一策略所获得的期望奖励. 

8. 令 S ( n , p ) 表示服从参数为 （ n , P ) 的二项分布的随机变童， 说明： 

P { B ( n , p ) < t } = 1 ~ p i B ( n < 1 - p ) ^ n - t - 1} 

提示： 将“成功的次数小于或等于 i ” 写成与之等价的关于失败次数的陈述. 

9. 如果 X 是一个服从二项分布的随机变童，期望为6,方差为 2.4, 求 P{X = 5}. 

10. —个坛子里有 n 个球，标号从1到 r », 如果依次随机地有放回地取出 m 个球，计算 
P{X = fc},fc = l , ••- , m , 其中 X 表示抽取的 m 个球里最大的号码. 

提示： 先计算 P{X < fc }. 

11. A 队和 B 队进行一系列比赛，先胜三局者为比赛的获胜者.假设每局 A 队获胜的概率为 
P , 且各局相互独立.求下列条件 槪率： 

( a ) 已知 A 队贏了第-局，求它最终获胜的条件 概率； 

( b ) 己知 A 最终获胜，求它贏了第一局的条件概率. 

12. 某个地方足球队将要参加5场比赛，如果它在本周末的比赛中取得了胜利，它将升入一个 
更高的级别中进行后四场比赛，如果它本周末的比赛输掉了，它就要降到•个更低的级别 
中进行后四场比赛.在高级别比赛中，该队每场比赛获胜的概率为 0.4, 且各场相互独立. 
在低级别比赛中，该队每场比赛获胜的概率为 0.7, 且各场相互独立.如果该队贏得本周 
末比赛的概率为 0.5, 那么它在后来的4场比赛中至少获胜3场的概率是多大？ 

13. —个7人陪审团里的每个成员作出正确决定的概率为0.7,且相互独立.如果最后的决定 
采取少数服从多数的原则，那么陪审团作出正确决定的概率是多大？假设已知陪审团的4 
人意见相同，那么陪审团作出正确决定的概率是多大？ 
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14. 某个地区平均来说,每年会遭遇 5.2 次飓风袭击,那么今年遭遇期风袭击的次数为3次或 
者更少的概率是多大？ 

15. 某个种类的昆虫产在一片树叶上的虫卵的数目服从参数为 A 的泊松分布.然而,这样的随 
机变量的取值只有当它为正整数时才能知道，因为如果是0的话，我们不会记录这个数， 
因为我们不知道这片树叶上是否有昆虫，令 Y 表示观测到的虫卵数，这样 

P{Y = *} = P{X = i|X > 0} 

其中 X 是一个服从参败为 A 的泊松分布的随机变量，求 E \ Y ]. 

16. 有 n 个男孩和 n 个女孩，每人都随机且独立地选择一名异性.如果正好有一名男孩和女 
孩互相选中了，那么他们将被 K 成一对.给女孩编上号码，令表示亊件“号码为 i 的 
女孩被配成了一对”，令 ft = 1 - POX ^ GO 表示没有任何一对配成的概率. 

⑷ P ( Gi ) 是多大？ （ b ) P ( Gi \ G ,) 是多大？ （ c ) 当 n 足够大时，求 P 0 的近似值. 

( d ) 当 n 足够大时，求忾的近似值，它是正好配成了 fc 对的概率. 

( e ) 利用关于亊件和的概率的容斥恒等式来计算 ft . 

17. 有 n 对夫妇组成的 2 r » 个人，随机地被分成 n 组，毎组两人.给妇女编上号码，令奶表 
示亊件“第 i 个妇女正好与她丈夫分在一组”. 

( a ) 求 

( b ) 对 求 

( c ) 当 n 足够大时，求没有妇女与她丈夫分在一组的概率的近似值. 

( d ) 如果在分组的时候规定必须是一个男人一个女人成为一个组，那么上述问题有怎样的 

答案？ 

18. 某个赌场的顺客在玩轮盘赌时，每次押5元在“红”，直到她一共贏了 4次. 

( a ) 她一共押了 9次的概率是多大？ （ b ) 她停下来时贏得的期望是多大？ 

注釋： 每次押注，她将以18/38的槪率贏得5元，以20/38的概率输掉5元. 

19. 有三个朋友去喝咖啡，他们决定用掷硬币的方式来确定谁 买单： 每人掷一枚硬币，如果有 
人的结果与其他两人不一样，那么由他买单.如果三枚硬币的结果是一样的，那么就重掷 
一轮.一直这样下去，直到确定了由谁来买单.求以下亊件 概率： 

( a ) 正好进行了三轮就确定了由谁来 买单； 

( b ) 进行了 4轮以上才确定了由谁来 买单. _ 

20. 如果 X 是服从参数为 p 的几何分布的随机变量，证明 E [ l / X ) = -广?) . 

1 -p 

提示：窬要计 算形如 ESxoVi 的表达式的值.要做到这一点，可利用 a i /i = ^ x i ~ 1 dx , 
然后交换积分和求和的顺序. 

21. 假设 

P{X = o } = p , P{X = b } = l-p 
( a ) 证明 （X - 6 )/(o - b ) 服从伯努利 分布； （ b ) 计算 Var ( X ). 

22. 你每局比赛获胜的概率为 p , 你计划玩5局，但是如果你贏了第5局，你就会继续玩，直 
到你输掉一局. 

( a ) 求一共玩的局数的期望. （ b ) 求一共输掉的局数的期望. 
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23. 坛子里开始有 AT 个白球 A # 个黑球，每次无放回地随机取出一个，求在取出 m 个黑球之 
前己经取出 n 个白球的概率 ， n < 

24. 将10个球放到5个食子中去.每次放球时与其他球的放置是相互独立的.每个球放到盒 
子 i 的概率为 P i ， E ?= iP * = 1.记兄为第 i 个盒子中所放的球数. 

( a ) Xi 的分布是什么？（尽可能具体） 

( b ) 对于 i / j , X * + &是什么类型的随机变量. 

( c ) 求户{不+义 2 +义 3 = 7}. 

25. 对于配对问题（见第2章例 5 m ), 

( a ) 求所配的对数的期望值. 

( b ) 求所配的对数的 方差. 

26. 设 X 为几何随机变量，其参数为 p , 并设 a 是 X 为偶数的概率. 

( a ) 利用 a = ESi p i x = 2 *}求出 a 的值. 

( b ) 利用条件 X = 1或 X > 1,求出 a 的值. 
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在第 4 章我们讨论了离散型随机变量，这类随机变 ft 的可能取值的个数或者 
是有限的，或者是可数无 限的. 然而，还存在一类随机变量，它们的可能取值是无 
限不可数的.比如以下的两个 例子： 火车到达某个车站的时间以及某个晶体管的寿 
命.我们称 X 为一个连螻型 ® ( continuous ) 随机变量，如果存在一个定义在实数轴 
上的非负函数/，使得对于任一个实数集下式成立 

P { XeB }= [ f ( x)dx (1.1) 

Jb 


函数/称为随机变量 X 的概率密度函教 
(probability density function ), 或者密度函 
数（参见图 5.1). 

换句话说， （ 1 . 1 ) 式说明了 x m 于 b 
的概率可以通过对概率密度函数在集合 
B 上积分得到.既然 X 必取某个值，因 
此/一定满足 

1 = P{X € (- 00 , oo )} = 厂 /( z)di 

所有关于 X 的概率都可以通过/进行计 
算 得到. 例如，令 S = [ o ,6], 通过 （1.1) 式 
可以得到 


在上式中令 a = 6,可以得到 



图 5.1 概率密度 函数： P(a < X < b ) 
等于阴彩部分面积 

(1.2) 


P{o < X ^ 6} = / f { x)dx 


P{X = a) = J f ( x)dx = 0 

也就是说，对于一个连续型随机变量，它取任何固定值的概率都等于 0. 因此，对于 


① 有 时也称 为絶对连績型 (absolutely continuous ). 

② 事实上， （1.1) 式仅仅对可《集 B 成立.当然，很幸运，现实中的集合都是可测集. 
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一个连续型随机变量，有 

• P{X < a } = P{X < a } = F ( a ) — J f ( x)dx 
例 la 假设 X 是一个连续型随机变量，其密度函数为 


/(*) 


C (4 x - 2 x 2 ) 
0 


0 < x < 2 

其他 


( a ) C 的值是多少？ （ b ) 求 

解： ⑷既然/是一个概率密度函数，那么一定有 /^/(^dx = 1,这意味着 


C j (4 x — 2 x 2 )dx = 1 


或者 C 2 x 2 - 


*=2 

*=0 


这样 C = 3/8,因此⑻ P{X > 1} = sr /( x)dx = I /, 2 (4 x - 2 i 2 )dx = i ■ 

例 lb 某台计算机在死机前连续运行的时间（单 位： 小时）是一个连续型随机 
变置，其密度函数为 


/(*) = 


J Ae -*/ 100 x^O 

lo i <0 


以下事件的概率是多少？ 

( a ) 该计算机在死机前运行的时间在50个小时到150小时之间； 

( b ) 运行时间不超过100 小时. 

解：⑷因为 

1 = / f ( x)dx = X j e _ */ 100 dx 

这样可得 

1 = - A (100) e -*/ loo |~ = 100 A 或 A = ‘ 

因此，电脑在死机前运行了 50 到 150 小时的概率为 

P {50 <X< 150} = / 15 ° Y 5 o e '* /100da: = -e' l/l00 |M° 

= e _1/s - e _3/2 « 0.384 

( b ) 类 似地： 

P{X < 100} = y 10 °^ e _l/100 di = - e -*/ 100 ^ 00 = 1 - e _1 w 0.633 
也就是说，电脑在连续使用 100 小时以前，大约63.3%的可能会死机. 
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例 lc 收音机的某种电子管的寿命是一随机变量，其概率密度函数为 


/⑷ 



x< 100 
x > 100 


假定收音机里有5个电子管，并且这些电子管的寿命是相互独立的，在150小时内， 
这台收音机的5个这样的电子管里正好有2个需要更换的概率是多大？ 

解 ：令在 表示“在给定时间内第 i 个电子管需要更换” (i = 1,2,…， 5), 

/ -150 rl50 ^ 

P ( Ei ) = I f ( x)dx = 100 / x~ 2 dx =- 
Jo Jioo 3 

利用事件尽之间的独立性，可得所求概率为 


©(^) (1) 3 = 黑 


分布函数 F 与密度函数/之间的关系可以表示为 

尸⑷ =€ (― oo ， aj } = / f ( x)dx 
对上式两边求导，得到 

^V) = /(a) 

也即，密度函数是分布函数的导数.从 （1.2) 式还可以得到一个关于概率密度函数 
更直观的 解释： 

P {° - I ^ X ^ a + ^} = J 2 /⑷如 *» e /( a ) 

其中 e 是一个小数，且/ ㈠ 在 z = a 处连续.换句话说， X 取值于以点 a 为中心， 
长度为 e 的小区间内的概率近似等于 ef ( a ). 通过这一点，我们可以看出， /( a ) 是 
随机变董取值于点 a 附近的可能性的一个度置. 

例 Id 设； f 是一个连续型随机变量，其分布函数为 F x ， 密度函数为 / x , 求 
y = 2 x 的密度函数. 

解： 用两种方法求解 / y . 第一种是直接求分布函数，然后求导， 

心⑷= P{Y < a } = P {2 X < o } = P { X ^ a /2} = F x ( a /2) 


求导 得到： , 

fy { a ) = $/ x ( a /2) 

另一方法是,注意到 

e/y(a) «p{a 一 <a+|} = ^{a-|<2J>f<a+|| 

= p {? _ 5 <x< ^ + i} ss l /x(o/2) 
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两边除以 e 就可以得到与前面相同的结果. 

5.2 连续型随机变置的期望和方差 

在第4章，我们定义了离散型随机变量的期望值如下 
E[X) = Y t ^P{X = x) 

如果 A ： 是一个连续型随机变量，其密度函数为 /(I), 那么由 
f ( x)dx w P{x < X < i + da:} 对于很小的 da; 

很容易看出，可用类似的方法定义连续型随机变量的期望值为 

E [ X ] = ^ x/(®)dx 

例 2 a 随机变量 X 的密度函数为 

{ 2 i 如果0彡 a : < 1 

0 其他 

求 E [ X ]. 

解： 

E [ X ] = J x /( x ) dx 

例 2b 随机变童； (： 的密度函数为 

’ 如果0彡 I < 


2 x 2 dx = - 


/(i) = 


其他 


求 £[e x ]. 

解：令 y = eX . 我们从计算 Fy ， 也即 y 的分布函数开始.对于 1 < a: < e ，有 

Fy(x) = P{Y < *} = P{e x < a:} = P{X < lnx}= f f(y)dy = lnx 

Jo 

对 f y ( x ) 求导，我们可以推导出 y 的概率密度函数 如下： 

/y(x) = - 1 < x < e 

因此， 

£ ； [e x ] = S [ y ] = J xJy { x ) Ax = dx = e — 1 ■ 

尽管上例中的方法是计算随机变童 X 的函数的期望值的常用的方法，但正如 
离散型情形一样，还存在另一种方法，下面的命題就类似于第4章的命题 4 _1. 
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命题 2.1 设 A ： 是一个连续型随机变量，其概率密度函数为 f ( x ), 那么对 
于任一实值函数有 

五 = / g ( x ) f ( x)dx 


在例 2 b 中利用命题 2.1 可得 

i 5[ e x ] = J e x dx = e — 1 因为 /( i ) = 1，0 < a : < 1 

这个结果与例 2 b 中的结果是一致的. 

命题 2.1 的证明比离散情形下更复杂，我们仅在随机变量 g ( X ) 非负的条件下 
证明本命题. ( g ( X ) 为一般的情况下的证明，作为我们给出证明的后续部分，见理 
论题2和 3.) 我们需要以下引理. 


引理 2.1 对于一个非负随机变童 y , 有 

E [ Y )=「 P{Y > y}dy 


证明： 本证明中，我们假定 y 是一个连续型随机变量，其密度函数为 / v •此 


时有 


f P{Y > y } dy = [ f f Y { x)dxdy 
JO JO Jy 

此处利用了事实 P{Y > y } = J ^ f Y { x ) dx , 交换上式的积分次序，可以得到 
J P{Y > y}dy = J dyjfy ( x)dx = jT xfy ( x)dx = E [ Y ] 
命题 2.1 的 证明： 对于任一函数 g , 其中 S ( z ) 彡 0, 根据引理 2.1, 有 


E\gW ] = 


P { 9 { X ) > y}dy = 
fBi x ) 


f ( x)dxdy 


= / f dyf{x)dx= f g(x)f(x)6x 

Jx : g (. x )>0 Jo Jx : g ( x)>Q 

这样，命题就得到了证明. 口 

例 2 c —根长度为1的棍子在点 C / 处断开，其中1/服从（0, 1) 上的均匀分布， 
求包含点 P 的那一截的长度的期望值 （0 < p < 1). 

解：令 L P { JJ ) 表示包含 p 的那一截的长度， L P { U ) 具有下列表达式（见图 5.2 
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的图解） 


L P (U ) = 


1-U u<p 


图 5 .2包含 P 点的部分： （ a ) U < p , ( b ) U > p . 
因此,利用命题 2.1 有 

E[L P {U)] = f L p ( u)du = f (1 — u)du + f udu 


= i_iLiP)! + I_^ = I 


+ p ( i - p ) 


既然 p(l - p ) 在 P = 1/2 时取最大值，这样，当 p 是棍子的中点时，包含 p 点的那 
一截的长度的期望取得最大值，这一点很有意思. ■ 

例 2 d 假设你去赴约，如果早到 S 分钟，那么将要花费 ca 元，如果晚到 s 分 
钟，那么将要花费 As 元.又假设从你所在地点到约会地点路途所要花的时间为一 
个随机变量，其概率密度函数为/,如果要使得花费的期望值最小，你应该什么时 
候出发？ 

解:令 X 表示路途所花时间,如果你在约会前 t 分钟出发,那么你的花费 C t ( X ) 
的公式为 

c ( t - X ) 如果久彡 f 
k(X - t ) 如果 X 彡 t 

因此， 


C t (X ) = 


E [ C t ( X )] = J C t (x)f(x) d ® = y c(t-x)f(x)dx + J k{x - t)f(x) dx 
=ct j f{x) dx — c J xf{x)dx + k J xf{x) Ax — ktj^ f(x) di 
对上式求导可得 

去 ElC t (XM = ctf ( t ) + cF ( t ) - ktf { t ) + ktf { t )- k [ l - F (<)] 

= {k + c ) F ( t)-k 

令上式等于0,便可得到，在约会前 t * 分钟出发可以使得花费的期望值最小，其中 



f 满足: 
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类似于第4章中的方法，我们可以利用命题 2.1 证明以下推论. 


| 推论 2 .1 如果 a 和 6 都是常数,那么 E[aX + 6] = aE [ X ] + b 

本推论的证明完全类似于离散型随机变量情形下的证明.不同之处仅仅在于 
求和换成了积分，分布列换成了密度函数. 

连续型随机变量的方差的定义也同离散型情况是一样的，也即，如果 X 是一 
个连续随机变量，期望值为叫那么 X (任何类型的随机变量）的方差定义 如下： 
Var ( X ) = B【(X - / i ) 2 ] 

另外一个公式就是， 

Var ( X ) = E [ X 2 ] - { E [ X }) 2 

该公式的证明方法同离散型情形也是一样的. 

例 2 e 求例 2 a 里的随机变 ft A ■的 Var ( X ). 

解： 我们先来计算 E [ X 2 }, 

E [ X 2 ] = j x 2 f ( x ) dx = J 2 i 3 dx = ^ 

由 E [ X ] = 2/3, 可以得到 Var ( X ) = (|) 2 = 爸. ■ 

类似于离散型情形，还可以 证明： 对于常数 a 和6,有 
Var ( oA ' + 6) = a 2 Var ( X ). 

有几类比较重要的连续型随机变最，它们在概率的应用中经常出现，接下来的 
几节将要介绍它们. 


5.3 均匀分布的随机变量 


一个随机变量称为服从 （0,1) 区间上的均 匀分布 (uniformly distirbuted ), 如果 


它的密度函数为 



(3.1) 


显然，/⑷ > 0,且/!^ f { x)dx = dx = 1,上式为一个概率密度函数.因为 
仅当 a : € (0,1) 时才有/⑷ > 0,因此, X 必然取值在 (0,1) 之间. 而且，既然/⑷ 
对于任意€ (0,1) 为常数，则 X 在 (0,1) 间任何值附近取值的概率都是相 等的. 
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要证明这点，注意到对于任意0 < a < 6 < 1,有 

P{o < X < 6} = J b f(x)dx = b-a 

也就是说， X 属于 (0,1) 的任一子区间的概率等于该子区间的长度. 

—般来说，我们称 A ： 为区间 （《,/?) 上服从均匀分布的随机变量，如果它的密 
度函数如下 

—如果 a < x </3 

卜 a (3-2) 

0 其他 

利用我们可由上式得到区间 ( a ,/3) 上的均匀分布的随机变量 
的分布函数为 


F ( a ) = 


图 5.3 显示的就是/⑷和 F ( a ). 

m 


a < a < P 

a> P 


li-H 



图 5.3 { a ,0) 上均匀分布的密度函数 /( a ) 和分布函数 F ( o ) 

例 3 a 令 X 在 ( a ,/3) 上服从均勻分布，求 （ a ) E [ X \, ( b ) Var ( X ). 
解 ：（ a ) 

0 2 - a 2 _ 0 + a 
2 一 


E [ X ] = 


xf ( x)dx = 




0 -a - 2(/9- a ) 

也就是说,在某个区间上服从均勻分布的随机变量的期望等于该区间的中点的值 ■ 
( b ) 为了计算 Var ( X ), 先计算 E [ X 2 ], 

3 1 ,, 0 3 -a 3 ^ + a0 + a 2 

J^ xAx = W ： ^) = ~3 — 


E [ X 2 ]= 



因此 
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Var ( X ) = ^± f ±^-^±^ = ^! 

这样,在某个区间上服从均匀分布的随机变量的方差等于区间长度的平方除以 12. ■ 
例 3 b 如果 X 服从（0, 10) 上的均匀分布，计算如下 概率： 

( a ) X < 3; ( b ) X > 6; (c) 3 < X < 8. 

*，(卿<0=备 

(b) m>6} = 0 - 盖 (c)P{3<X<8} = ^id*=i ■ 

例 3 c 公共汽车从早上 7 点钟开始，到达某一车站的时间间隔为15分钟.也 
就是说，汽车到达的时间为7点，7点15, 7点30, 7点45,等等.如果某个乘客到 
达车站的时间服从7点到7点半之间的均匀分布，求以下事件的概率： 

( a ) 他等公共汽车的时间不超过5 分钟； 

( b ) 他等公共汽车的时间超过10分钟. 

解：令 X 表示从7点到该乘客到达车站的时间差（分钟)，这样 X 就是一个区 
间在 （0, 30) 上服从均勻分布的随机变; t . 乘客等待时间不超过5分钟，当且仅当 
他到达时间为7点10分到7点15分之间，或者7点25到7点30之间.因此⑷ 
所求概率为 

P{10< X<15} + P{25<X<30} = ^ o ; dx + / 5 ^ dx = | 

类似地,他等待时间超过10分钟，当且仅当他到达时间为7点到7点5分之间，或 
者7点15到7点20之间，因此 （ b ) 所求概率为 

P {0 < X < 5} + P {15 < X < 20} = ^ ■ 

接下来的例子是法国数学家贝特朗于1889年首先考虑的问题，通常称为贝特 
朗悖论.它说明，早期概率论中的概率这个概念来源于几何概率 • 

例 3 d 考虑随机地从圆中取一根弦，该弦的的长度大于该圆内接正三角形的 
边长的概率是多大？ 

解： 上述问题其实是无解的，因为随机取弦的定义并不 明确. 下面将用两种不 
同的方法来重新阐述这个问题. 

第一种 方法： 弦的位置可由它到圆心的距离确定，此距离的变化范围为0到 
其中 r 为圆的 半径. 这样，当弦与圆心的距离小于 r /2 时，弦长将大于圆内接等边 
三角形的 边长. 因此，假设随机地取弦意味着弦到圆心的距离 D 服从0到 r 的均 
匀分布，因此，该弦的长度大于内接等边三角形的边长的概率为 
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图 5.4 随机取弦 


第二种方法是这样考虑随机取 弦：通 
过弦的一端作切线，那么弦与切线之间的 
夹角0的变化范围为0°到180°,它决定了 
弦的位置（见图 5.4). 而且，当0在60°到 
120°之间时，弦的长度大于圆内接等边三 
角形的边长.因此，假设随机的弦意味着》 
在0°到180°之间均匀分布，因此在这种 
假定下所求概率为 


P {60 <0< 120} = 


120 -60 1 
180 = 3 


注意到进行这样的随机试验时，正确答案可能是1/2,也可能是 1/3. 假设桌上 
画了好多平行线，平行线之间的距离为 2 r ， 现将一个直径为 2 r 的圆盘往桌上扔，那 
么，这个圆盘必定与某条平行线相交，该平行线与圆盘相交形成一条弦.这条弦的 
长度决定于圆盘的圆心在平面上的位置.此时，这条弦的长度分布与第一种情况相 
适应.因此，弦的长度大于内接正三角形边长的概率为 1/2. 如果在桌子上画一个 
半径为 r 的圆，在圆周上取一点，记为汔在>1点上钉一根可以任意绕 A 点转动的 
针，这个针与圆周总会相交而得到一条弦，而这条弦的长度分布就与第二种情况相 
同，其长度大于内接正三角形边长的概率为 1/3. ■ 


5.4 正态随 机变量 


我们称 X 为服从参数为 m 和/正态分布的随机变量，或者就简单称为正态 
随机变量，如果 X 的密度函数为 


/(x) = 




该密度函数是一条关于 M 对称的钟型曲线（如图 5.5). 
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1733年,法国数学家亚伯拉罕_棣莫弗引入了正态分布，并将它用在近似计算 
二项随机变童当 n 很大时的取值概率.这个结果后来被拉普拉斯和其他一些数学 
家做了推广，现在被概括为一条概率论定理一中心极限定理.这点将要在第8 
章介绍.中心极限定理是概率论中两个重要的结果之一 ®, 它给出了实际中出现的 
许多随机变量服从正态分布的理论根据.下列都是一些艰从正态分布的例 子：一 
个成人的身高，一个气体分子在任意给定方向上的运动速度，测量物体质童时的误 
差等. 

为了证明 f { x ) 的确是一个密度函数，我们要证明 



作替换 y = (x- n)/(T 可得 

-)=-r = 1 Z 100 e -» a /2 dy 

yjlna J-oo V2n 7-oo 

因此,我们必需证明 

J e~ v， ^ 2 dy = V2n 

令 J 那么 

= 厂 e-vV2 dy r e _*V»d* = 厂厂 e-^^dydx 

J—oo J—oo J —oo J—oo 

我们通过将变量转换为极坐标形式来求解上面的二重积分（也即令 I = rcos0,y = 
rsind, 且 dyd® = rd0dr), 

I 2 = [ [ e _r3/2 rdddr = 2n f re~ r，/2 dr = -2jie _rS/2 |^° = 2n 

Jo Jo Jo 

因此, J = ^, 这样结论就得到了证明. 

另外一个关于正态分布的重要结 论是： 如果X是一个服从参数为 M 和 a 的 
正态分布的随机变量,那么 Y = aX + 6也服从正态分布，其参数为 a M + «> 和 aV 2 . 
为了证明这点，假设 a > 0(a < 0时证明类 似). 令 i=V 表示^的分布函数，那么 

Fy{x) = P{Y < z} = P{aX + 6 < x} = P^X < = (—— ) 

其中 a 为 x 的分布函数.求导可得 y 的密度函数为 

斤⑷= l fx (^) = m ) 2/2ct2 } 

=~^=— exp{-(x — 6 — a/i) 2 /2(a<T) 2 } 


①另一个是强大数定律. 
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这样就证明了， y 确实服从参数为 a/ i + 6 和 a 2 ( T 2 的正态分布. 

上述结论的一个重要应用就是，如果 X 是一个参数为（叫 a 2 ) 的正态分布随机 
变量，那么 Z = {X - 離 就是一个服从参数为（0, 1) 的正态分布.这样的随机变 
量称为标准正态随机变量. 

接下来证明，正态分布的参数 M 和 a 2 分别代表了它的期望和方差. 

例 4 a X 是一服从参数 m 和 ff 2 的正态分布的随机变量，求 £[ X ] 和 Var ( A -). 
解： 先从计算标准正态分布随机变量 Z = ( X - ^)/0 的期望和方差开始，有 

m= £ iWi)di = 去 /I ie " I/2di= - 去 〆 n 0 

因此， 

Var ( Z ) = E [ Z 2 ] = ^厂 x 2 e ~ x ^ 3 dx 
通过分部积分 （ t * = i,dv = xe -* a /2) 得到 

vor<z) - 忐 (- ie -HO、) 

由 X = n + aZ 得到 

E \ X \ = n + crE [ Z ] = fi 及 Var ( X ) = tr 2 Var ( Z ) = a 1 ■ 

按照传统的记法，一般将标准正态分布的分布函数记为 ^( x ), 也即 
* (1) = 

对 于—个 非负数的值在表 5.1 已经给出.对于一个负数 a :, $( x ) 的值 
可以通过 （4.1) 式计算得到 

$(—®) = 1 — $( i ) — 00 < a ; < 00 (4.1) 

公式 (4.1), 可以利用标准正态密度函数的对称性得到，证明留作习题.该公式表明， 
如果2是一个标准正态分布的随机变童，那么 

P{Z < — x } = P{Z > x } — oo < x < oo 
因为当 X 服从参数为 P 和 < T 2 的正态分布时 ， Z = { X - M )/<7 服从标准正态分布， 
因此, x 的分布函数可以 写成： 

FxW =尸{义 < a } = p { X <： 

例 4 b 如果 A •服从正态分布，参数为 M = 3和 a 2 =9,求 
( a ) P {2 < X < 5}; ( b ) P{X > 0}; ( c ) P{\X - 3| > 6}. 
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解 : (a)P { 2<X<5} = p{^<^<^} = P{-i<^<I} 

“(I 卜 (4) = - 卜 D 卜 03779 

( b ) P { X > 0} = p {^>^}= P { Z >-1} = 1-$(-1)=$(1)«0.8413 

( c ) P{\X - 3| > 6} = P{X > 9} + P { X < -3} 

X — 3 9 — 3) _ r — 3 _ 3 — 31 

=P { 丁 > l -} + P { 丁 <丁} 

= P{Z >2} + P { Z < -2} 


表 5.1 ^( x )： 标准正态分布密度曲线下 a ; 左侧的面积 


8 359753 1411 §224 I s I SI 177319 P 633706767817 1 SSEEE 
5566 6j 7778888 9(99.9.9.9.9.9.9.9.9.9.9 .9 .9.9.9 .9 .9 .9.9 .g.9 

二 ■ ■ I =:s=:ss:s ? 丽 :sis E = i 

… 娜 … s E S E s = ?zs.9972:=s 纖 .9997 

M SS.7764S=E sssi s 

M2-l:zErs:zss 撤 

M = = E:s … =1 .9788 1 …！ Err 

二 lss:s:ris:=ss:=:r 纖 

二 I s:sl:z:s:zr:si =:z:ss s I 

Ml 11 s:z 皿 i:si:z:s:s:s:ss 

x.0.l.2.3.4.5.6.7.8.91.0l.l1.21.31.41.5 s1.72s 2.02.12.2 s 2.42.s2.62.7 s 2.93.a3.1 s 3.33.4 
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=1 - $(2) + $(-2) = 2[1 - $(2)] « 0.0456 ■ 

例 4 c 进行一次考试，如果所有考生所得的分数可近似地表示为正态密度函 
数（换句话说，各级考分的频率图近彳以地呈现正态密度的钟形曲线 . ），则通常认为 
这次考试（就合理地划分考生成绩的等级而言）是可取的.教师经常用考试的分数 
去估计正态参数 M 与然后把分数超过 ti + a 的评为 A 等，分数在 m 到 M ^ 
之间的评为 S 等，分数在到之间的评为 C 等，分数在到之 
间评为 D 等,分数在 M -2 a 以下者评为 F 等.（有时称这种方法为“曲线上”划分 
等级法）由于 

P{X >fi + a }= P {^-^ > l } = l - 伞⑴ 《 0.1587 
P { H<X <n + a }= P {0< - < l } = $(1) - $(0)« 0.3413 

P { ix -< T<X < fi }= p {- l < - <0} = *(0) - #(- l ) « 0.3413 

P { n -2 a <X < n - a )= p [-2< < - l } = $(2) - $(1) « 0.1359 

P{X < n -2 a }= P {—^ < -2} = $(-2) « 0.0228 

所以，近似地说，这次考试中，能获得 4 等的占 16%, S 等的占 34%, C 等的占 34%, 
£>等的占 14%, 成绩很差的占 2%. ■ 

例 4 d 某人被指控为一个新生儿的父亲.此案鉴定人作证时 指出： 母亲的怀 
孕期（即从受孕到婴儿出生的时间）的天数近彳以地服从正态分布，其参数为 M = 270, 
< t 2 = 100. 被告提供的证词表明，他在孩子出生前 290 天出国，而于出生前 2 40 天 
才回来.如果被告事实上是这孩子的父亲，试问那位母亲确有与证词相符的、过长 
或过短的怀孕期的概率是多少？ 

解：设 X 表示怀孕期的天数，并假定被告是这孩子的父亲，那么孩子生于与 
证词相符的时间内的概率是 

P{X > 290 或; f < 240} = P{X > 290} + P{X < 240} 

=1- $(2) + 1 - $(3)« 0.0241 ■ 

例 4 e 考虑从 A 地到 B 地通过电信传送一个二值信号，0或 1. 然而，数据通 
过电信传送过程中会遇到噪声干扰 • 为了减少传送出错的概率，当传送的信息为1 
时，将传送值2,传送信息是0时，就传送值 -2. 如果 a :, a : = ±2为在 A 地传送的 
数值, i ? 为在 B 地接收到的数值， {R = x + N,N 为噪声干扰)，当信号在 B 处接收 
后，按如下解码规则. 



5.4 正态随机变量 185 


如果 i ? > 0.5, 则认为是 1; 如果 ii < 0.5, 则认为是 0. 

如果噪声服从正态分布，我们将要计算 AT 为标准正态随机变童情形下的出错 
概率 • 

共有两类错误.其一是信息1被错误地认为是0;另一类是信息0被错误地认 
为是 1. 第一类错误会在下列情形 发生： 如果信息是 1, 且 2 + W < 0.5, 而第二类错 
误会在下列情形 发生： 信息是 0, 且 -2 + iV > 0.5. 因此， 

尸{ 错误 | 信息是 1} = P { N < -1.5} = 1 - $(1.5) « 0.0668 

P { 错误 | 信息是 0} = P{N ^ 2.5} = 1 - $(2.5) w 0.0062 ■ 

二项分布的正态近似 

概率论里一个重要结论，称为棣莫弗-拉普拉斯极限定理.说明当《很大时， 
参数为 ( n , p ) 的二项随机变量可用正态随机变量来近似.正态分布的期望与方差与 
二项随机变 量的期 望和方差相同 ( n P > np(l - p )). 棣莫弗在 1733 年证明了 p = 1/2 
的特殊情形.尔后，在 1812 年，拉普拉斯对一般的 p 进行了证明.更一般的叙 
述是： 我们可以如下将二项随机变量标准化，先减去其均值 np ， 然后再除以标准 
差那么经过标准化的随机变童（均值为0,方差为 1) 的分布函数当 
n — oo 时收敛到标准正态分布函数. 

棣莫弗-拉普拉斯极限定理 在 n 次独立重复试验中，设每次成功的概率 

为 P , 记成功的次数为则对任何 a <6 有：当 n — oo 时 

由于上述定理仅是第8章研究的中心极限定理的一个特殊情形，故这里不再 
证明. 

大家看到,对于二项分布，我们已经有了两个可能的近 似：当 n 较大而 p 较小 
时,泊松近似是一个很好的 近似; 另外，可以证明，当 np ( l - p ) 较大时，正态近似相 
当好，见图 5.6. [—般来说，当 rtp(l - p ) > 10 时，正态近似就相当好 •] 

例 4 f 以 X 表示抛 40 次均匀硬币出现正面的次数.试求 X = 20 的概率•运 
用正态近似法，再与精确解比较. 

解： 为了利用正态近似，注意到因为二项分布是离散整数值随机变童，而正态 
分布为连续型随机变量，因此最好在正态近似前将= i } 写为 P { i ~ 1/2 < X < 
i + 1 / 2 } [这也称 为连续性修正 (continuity correction )]. 这样 

P{X = 20} = P {19.5 《X < 20.5} 

r 19.5 -20 X - 20 20.5 -20\ 

= p i~7!u _< "7ir <- 7!0 _ J 





图 5.6 二项分布 ( n , p ) 的概率分布列随着 n 的增大越来越趋于正态分布 


例 4 g 某学院计划招收150名一年级新生.根据以往的经验，接到录取通知 
的人当中，平均只有30%的人报到入学，故学院给450名学生发录取通 知书. 试求 
这所学院入学新生超过150名的概率. 

解：记 X 为入学新生人数，那么 A •为以 n = 450 , p = 0.3 为参数的二项随机 
变量.利用连续性修正及正态近似，可得 

cn e 彳 en ^ n Q 、 

-$( 1.59)*0.0559 


150.5} = P {-^ 


450X03 ^50 5-450 x0.31 

’ I a en n o n *7 | 


< 0.3 x 0.7 ^ V 450 x 0.3 x 0.7 J 
这样，在接到录取通知的人当中，入学者超过150名的可能性不超过6%•(这 
里我们做了怎样的独立性假设?） ■ 

例 4 h 为测定能降低血液中胆固醇含量的某种食品的有效性，营养学家让100 
个人吃这种食品.经充分长的时间后，化验他们的胆固醇 含量. 如果至少有65%的 
人在吃了这种食物以后胆固醇含量降低，则进行这项试验的营养学家就决定承认这 
种食品.如果这种食品事实上对胆固酵含量不起作用，试问这位营养学家承认它的 
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概率是多大？ 

解： 我们假定这种食品对降低胆固醇含量不起作用,而一个人在吃了这种食品 
后碰巧胆固醉降低的概率为 1/2. 这样，若以X表示胆固醇降低了的人数，则当这 
种食品不影响胆固醇含童时，营养学家承认它的概率是 


?(?)©" 


= P{X > 64.5} = P - 


^100 x 5 x 5 


« 1 - $(2.9) w 0.0019 


例 4i 纽约市有52%的居民支持禁止公共场合吸烟.随机抽取 n 个纽约市民， 
问支持这项禁令的人数超过50%的概率有多大，如果 


(a) n = 11; (b) n = 101; (c) n = 1001. 

要想该概率值超过 0.95, n 需要多大？ 

解：令 JV 表示纽约市居民人数.要回答上述问题，我们必须首先理解样本大 
小为 n 的随机抽样就是从 W 个人当中按如下方式抽取 ri 人： 使得种《个 
人的子集被抽到的可能性都是一样的.这样，记&为样本里支持禁令的人数，它 
是一个超几何随机 变董. 也即， S„ 的分布与从装有 AT 个球的坛子里抽取 n 个球， 
其中取出的白球数的分布是一样的（其中 0 . 52 N 的球为白球).但因为 7V 和 0.52JV 
对于 n 来说都是很大的数，根据二项分布对超几何分布的近似（见 4.8.3 节）可知, 
也即 S„ 的分布与参数为 n 和 p = 0.52 的二项分布是很接近的.再利用正态分布 
对二项分布的近似可得 


P { S n > 0.5n} = 


P { 

P i 


S n — 0.52n 
v/n x 0.52 x 0.48 
5 n — 0.52n 
v/n x 0.52 x 0.48 


0.5n — 0.52n "i 

> y/n x 0.52 x 0.48 J 

> -0.04\/ri| « $(0.04\/n) 


因此, 


{ $(0.1328) = 0.5528 如果 n = 11 
$(0.4020) = 0.6562 如果 n = 101 
$(1.2665) = 0.8973 如果 n = 1001 

为了使得该概率大于 0.95, 我们需要 $(0.04^ > 0.95. 因为 $(a:) 为一单调递增 


函数，且 $(1.645) = 0.95, 因此 O.fMv/n > 1.645, 也即 n 彡 1691.266. 因此，样本大 
小至少为 1692. ■ 


关于正态分布的历史注记 

正态分布是法国数学家亚伯拉罕.棣莫弗在1733年引 入的. 他利用正态分布 
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求出了有关抛掷硬币试验中随机事件的概率的近似值.当时称正态分布为指数钟 
形 曲线. 1809年，德国著名数学家高斯以正态分布作为主要工具预测天文学中星体 
的位置,这时才展现了正态分布的应用价值.此后，正态分布就称为高斯分布. 

在十九世纪后半叶,大部分统计学家认为大部分数据的直方图都具有高斯钟形 
曲线的形状.事实上，大家认为正常的数据集合应该具有这种形状.由英国统计学 
家卡尔 • 皮尔森开始，将高斯曲线简称为正态曲线.（中心极限定理为许多数据具 
有正态分布的事实提供了合理的解释，我们将在第8章讲述这一定理 

亚伯拉罕 • 棣莫弗 (1667—1754) 

现在统计学已经普及，统计学家具有很好的工作环境.然而，统计学的诞生地 
却是在18世纪初的伦敦,一所黑暗的、肮脏的赌窟，称为屠夫咖啡屋的地方.亚伯 
拉罕_棣莫弗是一个来自天主教法国的耶稣教难民，为生计，他要为各种赌博计算 
赔钱的概率. 

虽然亚伯拉罕.棣莫弗在咖啡屋内谋生存，但他是一位著名的数学家，他发现 
了正态曲线.他还是盥家学会的会员，并且是著名科学家牛顿的朋友. 

统计学家卡尔.皮尔森想象棣莫弗在屠夫咖啡屋内工作的 情景: “我想象棣莫 
弗坐在咖啡屋内航脏的小桌边，旁边坐着一位破产的赌徒.而牛顿从嘈杂的人群走 
向棣莫弗的小桌边，拉出他的朋友.在艺术家的想象中，这是一幅多么伟大的艺术 
杰作啊。” 

卡尔.弗里德里克.高斯 (1777—1855) 

高斯，正态曲线的最早应用者之一，是一位伟大的数学家.著名的数学史学家 
E . T . Bell 在1954年的著作{数学人物 》 (Men of Mathematics ) 中，有一章名为 
“数学王子”中提到了三位数学家，阿基米德、牛顿和 高斯. “他们三位是在最伟大 
数学家之列，我们不可以以通常眼光来评价他们的贡献的 大小. 他们在纯数学和应 
用数学领域内推波助澜.阿基米德特别推崇纯数学，牛顿恰恰是把他的数学发现应 
用于科学研究，而高斯宣称无论是纯数学还是应用数学对他而言都是一样的 . ” 


5.5 指数随机变量 

如果随机变量的密度函数 如下： 对于 A > 0,有 

I Ae -** 当 a : > 0 

/(*) = { ^ 

[0 当 x < 0 

那么称该随机变量为参数为 A 的指数分布的随机变量（或简称为指数随机变量) • 
指数随机变量的分布函数如下:^ 

= 厂 •\e- Ax dx = -e- Xl G = l-e_ Aa a^O 
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下面将要说明参数 A 就等于期望值的倒数. 

例 5a 令X为一参数为 A 的指数随机变童，计算 （a) E [ X ], (b) Var(X). 
解 ：（a) 因为密度函数为 


/(*) = 


0 


x ^ 0 
x <0 


因此，对于 n >0, 有 ^ 

E [ X n ]= [ x n \ e~ Xx dx 
Jo 

分部积分 ( Ae - Ax da : = dv,u = x n ), 可以得到 

£[ X n ] = - i n e -Ax 『 + [°° e - Xx nx n - l dx 
Jo 

= 0+ ' j : \ e -^ x n ~ l dx = 

令 n = 1, 及 n = 2, 可以得到 

E [ X \ = \ E [ X *\ = Ie [ X ) = ^ 

( b ) 因此 

Var ( X ) = ^- Q ) 2 = ^ 

即指数分布的期望值等于参数 A 的倒数，而方差等于期望的平方. ■ 

在实践中，指数分布经常作为某个事件发生的等待时间的分布而 出现. 比如， 
地震发生的时间间隔（从现在开始计算)，一场新的战争爆发时间间隔，从现在开始 
到你 接到一 个误拨的电话的时间间隔，等等，这些都是实践中的指数随机变量.（关 
于这种现象的理论解释可参考 4.7 节 .） 

例 5 b 假设某个电话的通话时长（单 位： 分钟）为参数为 A == 1/10的指数随 
机变量.假设某人正好在你之前到达电话亭，求以下事件 概率： 

( a ) 你的等待时间超过10分钟： （ b ) 你的等待时间在10到 2 0分钟之间. 
m •■令 X 表示该人通话时长，那么所求概 率为： 

( a ) P{X > 10} = 1 - F (10) = e - 1 « 0.368 

( b ) P {10 < X < 20} = F (20) - F (10) = e ~> - e ~ 2 « 0.233 ■ 

我们称一个非负随机变量 X 是无记忆的 （ memoryless ), 如果 

P{X > s + «|X > 0 = P{X > «} 对所有的 M 彡 0 成立 （5.1) 
如果我们令 A ： 为某个设备的寿命，上式说明了在己知该设备已经使用 * 小时的条 
件下寿命至少为 s + t 的概率，与开始时寿命至少为 s 小时的概率是一样的.换句 
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话说，如果该设备在使用 f 小时后还能使用，那么“剩余的”寿命同一开始时的寿 
命的分布是一样的（即就好像该设备对已经使用了 t 小时没有记忆似的). 

条件 (5.1) 又等价于 


或者 


P{X > s + t,X > t ) 
P{X > t } 


= P{X > s } 


P{X >s + t } = P{X > a } P{X > t } (5.2) 

当 X 服从指数分布时,公式 （5.2) 是成立的 ( e -^+*) = e -*» e -^). 因此，指数随机 
变童是无记忆的. 

例 5 c 某个邮局有两个职员，假设当史密斯先生走进邮局时,他发现两个职员 
正在分别接待琼斯女士和布朗先生.史密斯先生被告知,一旦处理完琼斯或者布朗 
的事情，就立即接待他.如果职员给每位顾客的服务时长都服从参数为 A 的指数分 
布,那么三人中，史密斯先生是最后一个办完事情的概率是多大？ 

解： 从史密斯先生开始接受服务时考虑，此时，琼斯女士和布朗先生中 有一个 
已经离开，另•个仍在继续接受服务.然而，因为指数分布是没有记忆的，因此，仍 
在接受服务的顾客（琼斯女士或布朗先生）的办事时长服从参数为 A 的指数分布， 
这与此时刚开始服务是一样的.因此，由对称性可得，剩下的一个人在史密斯先生 
之前完成服务的概率为 1/2. ■ 

可以证明，不仅是指数分布具有无记忆性，而且指数分布是唯一具有无记忆性 
的 分布. 为了证明这点， 假设； f 是无记忆性的，且令 ^( x ) = P{X > x }. 那么，利用 
公式（5.2)，可以得到 F ( s + t ) = F ( s ) F ( t ), BP F () 满足函数方程 g { s + t ) g (8) g ( t ). 
然而，已经证明该函数方程的唯一的非平凡右连续解就是® 

g { x ) = e~ Xx (5.3) 

又因为分布函数总是右连续的，因此我们有 

F ( i ) = e- Ax 或者 F { x ) = P{X < i } = 1 - e~ Al 


①可以如下证明 （5.3) 式： 如果 g(a + t )= S (*) s ( t ), 那么 

重复以上计算可以轉到 9 ( m / T .)= fl m ( l / n ). 而且， 

因此， g ( m / n ) = ( 9 ( l )) m/n . 9 是右连续的，可以得出 =(9 ⑴) * •又因抑）= 

( s ( 5 )) 2 > 0 , 我们可以得到 9 (*) = e - A *, 其中 A = _ ln ( p ⑴). 
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这样，就证明了 X 服从指数分布. 

例 5 d 假设汽车在电池用完之前跑的英里数服从均值为10 000英里的指数 
分布，如果某人要计划开始一个5000英里的旅行，那么他不用更换电池就能跑完 
全程的概率是多大？如果不服从指数分布呢？ 

解： 由指数分布的无记忆性可以得到，电池剩下的寿命（以1000英里为单位) 
服从参数为 A = 1/10的指数分布.因此，所求概率为 

/"{剩余寿命 > 5} = 1 - /= e~ sx = e ~ 1/2 « 0.604 


然而，如果剩余寿命 F 的分布不是指数分布，那么对应概率为 
寿命 > t + 5| 寿命 > 0 = 1 ~^ t y ) 

其中 t 就是旅行前电池已经使用的寿命.因此，如果不是指数分布，那么在计算所 
求概率之前还需要了解其他信息（也即 <). ■ 

指数分布的一个变形是一种取值或正或负，们.是绝对值服从参数为 A ( A 彡 0) 
的指数分布.这样的随机变量也称为拉脊拉斯随机变它的密度函数为 

/W = 卜-砌 1 — oo < a : < oo 

其分布函数 如下： 


F ( x ) 


^ J X \ e Xx dx 



x < 0 
® > 0 


例 5 e 我们来重新考虑例 4 e ， 从 A 地传送一个二值信息到 B 地.当信息为1 
时，传送2,当信息为0时传送 -2. 然而，通信噪声 W 不再是标准正态随机变量， 
而是参数为 A = 1的拉普拉斯随机变量.假设如果在 B 地收到信息如下 解码： 


如果那么认为是1; 

如果 il < 0.5, 那么认为是 0. 

这种情形下，如果噪声为参数 A =1 的拉普拉斯随机变量，那么两类错误的概率如 
下 

P { 错误 | 信息是 1} = P { N < -1-5} = \ e~ 1B « 0.1116 
P { 错误 I 信息是 0} = P{N > 2.5} = ie - 2 5 « 0.041 
将此结论与例 4 e 对比，可以发现，噪声为参数为 A = 1的拉普拉斯随机变童时的 
错误概率要大于为正态随机变量时的 概率. ■ 


①有时也称为双指数型随机变 ft. 
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危险率函数 


考虑一个正连续型随机变量 X ，我们将它解释为某个零件的寿命,具有分布函 
数 F 以及分布密度 /• 危险率 (Hazard rate , 有时也称为失效率 , failure rate ) A ⑴定 
义 如下： m 

m = 截， 其中户 = i-f 

为了解释 a ⑷，考虑该零件已经使用了 <小时,我们来求它不能继续使用出小时的 
概率,也即求 P{xe (t,t + dt)\x>t). 利用条件概率公式， 

P{X e(t,t + dt)\x>t}= p {Xe(t,t+dt)^x>t} = 

因此, A ⑴表示了 “年龄”为 t 的零件不能继续使用的条件概率强度. 

现在假设寿命服从指数分布，那么，利用它的无记忆性，可以得到对于一个“年 
龄”为 t 的零件，它剩下的生存时间同一个新零件是一 样的. 因此, A ⑴必然是一 
个常数.这点可以检验如下 




Xe~ xt 、 

因此，措数分布的危险率函数是一个常数.由危险率函数的定义可知，由分布可以 
计算它的危险率函数.反过来，由危险率函数也可以唯一地确定它的分布函数.为 
证明这一点，将 A ⑴的公式 


m = 


两边积分可得 


令 t = 0 可得 fc = 0, 因此 


-尸⑴ 

ln(l - F ⑴) =-f A(«)dt + k 
1 - = e * exp { 一 / 

•F ⑴ = 1 — exp { - / A(f)dt| 


(5-4) 


因此，一个正连续型随机变量的分布函数可由其危险率函数确定.比如说，如 
果随机变量具有线性危险率函数，即如果 

A(t) = a + bt 

那么其分布函数为 

F(t) = 1 - e - at ~ bta/2 

求导可得 

/(«) = (o + W ) e _(ot+w2/2) f >0 
当 a = 0时，上述即为熟知的瑞利 ( Rayleigh ) 分布的密度函数. 
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例 5 f 人们经常听到，各个年龄段吸烟者的死亡率是非吸烟者死亡率的2倍， 
这是什么意思？是不是说对于同年龄的非吸烟者和吸烟者来说，前者活到一个给定 
时间的概率是后者的两倍？ 

解：令 X ,( t ) 表示年龄为*的吸烟者的危险率，而 X „( t ) 表示年龄为 f 的非吸 
烟者的危险率,上述的含义等价于 A ,( t ) = 2 A „ ⑴. 

—个年龄为4的非吸烟者能活到年龄 S 的概率 （>4 < S ) 为 
P { 年龄为 A 的非吸烟者能活到年龄 

={非吸烟者的寿命> si 非吸烟者的寿命 > 4} = m ) 

exp \ - f A „ ⑴ df } 

- L - A . - L 利用 (5.4) 

exp I 、(⑽} 

= exp {- 厂 A „ ⑴ dt } 

而根据相同的原因，对应的吸烟者的概率为 
年龄为4的吸烟者能活到年龄 5} 

= exp | - J A •⑴ dt} =exp| ~ 2 A„(t)dt} = [exp{ _ 人 A„(t)dt|] 

也就是说，对于两个年龄相同的人来说，其中一个吸烟，另一个不吸烟，那么 
吸烟者能存活到一个给定年龄的概率是非吸烟者的相应概率的平方(而不是—半) • 
举例来说，如果= 1/30,50 ^ t < 60,那么一个50岁的非吸烟者能活到60岁 
的概率是 e - 1 / 3 » 0.7165, 而吸烟者的相应概率为 e - 2 / 3 « 0.5134. ■ 

5.6 其他连续型分布 


5.6.1 r 分布 

如果随机变量具有密度函数 


/(I)= 


naT 


c > 0 
c < 0 


其中 r ( a ) 是 r 函数，则称该随机变量具有 r 分布，其参数为 ( a , A),a >0, A >0. V 
函数的定义如下： 

r ( a )= f e ~ v y a - l dy 
Jo 


分部积分可以得到 
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r ( a ) = - e - VT + l)y°- 2 dy 

Jo 

= (o - 1) f e~ v y a - 2 dy = (a - l ) r(a - 1 ) (6.1) 

Jo 

对于整数 a , 比如说 a = n, 可以重复利用公式 (6.1) 得到 


r ( n ) = ( n - l ) r(n - 1 ) = (n - l)(n - 2 ) r(n - 2 ) 
=...=( n - l )( n - 2 ) … 3 - 2r ( l ) 


又因 r ( l ) = / 0 °° e-*dx = 1 , 所以可以得到 r ( n ) = ( n - l )!. 

当 a 为一正整数时，比方说 a = n , 参数为 （ o , A ) 的 r 分布在实践中经常作为 
某个事件总共要发生 n 次的等待时间的分布而出现.尤其是，当个事件是随机 
发生的，且满足 4.7 节的三个条件，那么可以证明要等待总共 n 个事件发生的时间 
为服从参数为 （ n , A ) 的 r 分布随机变貴.为了证明这点，令： T „ 表示第 n 个事件发 
生的时间，并注意到 T „ 小于或等于 < 的充要条件是在时刻 t 以前至少发生了 n 个 
事件，即时间区间内发生的事件数 N ( t ) > n . 因此 

P { T n < t } = P { N ( t ) ^ n } = £ P { N ( t ) = j } = f ； 

j=n j=n 3 ' 

其中最后一个等式成立是因为在 [0, fl 内发生的事件数服从参数为 At 的泊松分布， 
对上式求导得到 r „ 的密度函数如下 


m 



-£ 


Xe~ xt (Xty 
~ j ! ^ 


Ae-^CAtp- 1 v 2 ' Ae- At (Aty 

= kn ~^ - 


Xe~ xt {\t) n 

( n -1)! 


因此，: T „ 服从参数为 ( n , A ) 的 r 分布.注意当 n = 1时，该分布退化为指数分布. 

A = 1/2 , a = n /2 的 r 分布为一个正整数）称为自由度为 n 的 x 2 ( 读作“卡 
方” ） 分布.在 n 维空间中试图击中某一靶子，其中各坐标的偏差相互独立且为标 
准正态分布，则偏差的平方和服从自由度为 n 的 x 2 分布 . X 2 分布与正态分布关系 
密切，我们将在第6章予以详细解释. 

例 6 a 令； C 为一服从 r 分布的随机变量，其参数为 a 和 A , 计算 


(a) E 闪 “b) Var(X). 
解： （ a) 


網 = 忐 r ㈣ 。‘ r 知-气 ㈣ 。如 


r(g + l ) = a 
Ar(aj = A 


利用公式 (6.1) 
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( b ) 先计算 E [ X \ 再利用方差的计算公式可得 Var ( X ) =聂.详细证明留作 
习题. ■ 


5.6.2 威布尔分布 


威布尔分布在工程实践中有着广泛的应用.最初,这种分布是在解释疲劳数据 
时提出的，但现在它的应用已经扩展到许多其他工程问题中.特别地，在有关生存 
现象的领域中，它有广泛的应用.例如，当某对象适合“最弱链”模型时，此对象的 
寿命就服从威布尔分布.也就是说，考虑一个有许多部分组成的对象，并假定当它 
的任何 • -部分毁坏时此对象的寿命就终止.在这样的条件下，已经（从理论上和实 
践上）证明威布尔分布为这个对象的寿命的分布提供了一个很好的近似. 

威布尔分布的分布函数具有如下 形式： 


— {-㈣ 


x 

x > V 


(6.2) 


如果一个随机变量的分布函数具有如上形式，那么称它为具有参数〃，《和的威 


布尔随机变量.对其求导可得到密度函数为 


/(*) = 




X 

x > V 


5.6.3 柯西分布 


一个随机变量称为服从参数为 9 ,-oo <0 <oo 的柯西分布，如果其密度函数 
如下： J 1 

/(g) = ni-Kx-^ 

例 6 b 假设有一束窄窄的光线围绕着某一个中心旋转，而这个中心位于 y 轴 
上离坐标原点一个单位处，当光线停止旋转时，这束光 指向: c 轴上一点 A •(若光线 
并不指向 X 轴，则重新进行试验).如图 5.7 所示， A ■由1/轴与光线的夹角0确 
定 . 0 的分布是（- 《 /2,n/2) 上的均匀分布，这样， X 的分布可由下式进行计算 
F ( x ) = P{X < z} = P{tan0 ^ i} = P {0 < arctan x ] = ^ ^ axctan x 

其中最后一个等式是因为 0 在 (-n/2,)i/2) 上服从均勻分布,分布函数为 


P {0 < «} 

因此， X 的密度函数为 

fix ) 


a — (― n /2) _ 




n(l + 1 2 ) 
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这样,我们可以看到 A ： 服从柯西分布夂 


7 W 



5.0.4 /3分布 

如果一个随机变量的密度函数如下，那么称它服从 分布： 
^ i 0_1 ( l -*) 6-1 0< x < 1 
其他 


/(z) = 


J B ( a , b ) 

|o 


其中 


B ( a , b )= 


i a _1 ( l - i) k_1 dx 


0 分布通常用来为取值于某有限区间的随机现象建立模型.当然，如果 
令 c 为原点，而 d _ c 为度量单位,那么可将取值区间转化为 [0, 1】. 

当 a = 6时,0分布的密度函数关于 I = 1/2对称，随着公共值 a 的增大，取值 
于1/2附近的权重会越来越大（见图 5.8). 当6 > a 时，密度函数向左偏斜（也即取 
小值的可能性更 大)； 当 a > 6时，密度函数向右偏斜（见图 5.9). 

B ( a , b ) = 称为0 函数. 可以证明，卢函数与 r 函数之间 

存在以下 关系： r ^ r ( h \ 

丑(。， 6 )=雜 _ 

利用 （6.1) 式和 （6.3) 式，易证，如果 X 为一参数为 a 和6的/ 3 随机变量，那么 

寧 1 = 土 …⑷= (a + 6)2( t + 6 + l) 

注释 (6.3) 式的证明将会在第6章例 7 c 中给出. 


①可用下面的方法证明等式 —(arctanx) = 1/(1+ X 3 ): 令 y 

i= £ (tany)= ^ (tanv) S = 


dx sin 2 y + cos 2 y tan 2 y + 1 


=arctanx, 那么 

/co8 2 y + sin 2 i 
V cos 2 y 

= x 2 + l 


)dx 





图 5.8 参数为 （< i ,6) 的/3分布，其中 a=b 


图 5.9 参数为 （ a , 6) 的/?分布, 
其中 oAa +6) = l /20 


5.7 随机变置函数的分布 


当知道一个随机变量的概率分布后，经常会感兴趣于求它的一些函数的分布. 
比如，假设我们己经知道了 X的分布，需要计算 g(X) 的 分布. 要做到这一点，需 
要将事件 9(X) < y 表达为 X 属于某集合的形式，我们将通过一些例子阐述这点. 

例 7a 令 A •为 （0,1) 上服从均匀分布的随机 变量. 我们可以如下得到随机变 
量 y = X"的分布.对于0 < v < 1,有 

F Y (y) = P{Y <y} = P{X n < ： y} = P{X ^ y l > n ) = F x (y 1/n ) = 2 / 1/n 


这样, y 的密度函数为 



0<y< 1 
其他 


例 7b 如果； C 是一个连续型随机变量,其密度函数为/X，那么 F = X 2 的分 
布可以如下得到，对于 y > 0,有 

F Y {y) = P{Y <i/} = P{X 2 <y} = P{-y/y ^ X ^ y/y} = F x (y/y) - F x {-^/y) 

求导可得： f Y [y) = + f x {-y/y)),y^0. _ 

例 7 C 如果 x 具有密度函数 /x， 那么 y = 的密度函数可以如下得到，对 
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因此,对其求导可得： fy { y ) = fx ( y ) + fx (- y),y > 0. 
以上例 7a 到例 7c 中使用的方法可用来证明定理 7.1. 


定理 7.1 令X为一连续型随机变量，其密度函数为 /x. 假设 sOr) 为一严 
格单调（逮增或递减）且可微（因此必连续）函数，那么随机变童 Y = g ( X ) 
的密度函数为 

= / /^b _1 (j/)]|^s _1 (y)| 如果存在某 a：， 使得 y = 5(1) 

10 如果对一切 z, y / 

其中 p _1 (y) 定义为满足〆 a：) = I/的 1 值- 

我们在为递增函数的情形下证明定理 7.1. 

证明： 假设对某些 a: 来说，有 = 那么，令 y = S(X), 

Fy(v) = P{g{X) <y} = P{X < ff _ 1 (y)} = Fxig^iv)) 


求导可得 . 

My) = /A(fl _l (»))^s _1 (y) 

由于 《?<(!/) 非降，因此导数非负. 

若 y / 0(a:) 对任意 x 成立，那么 Fy ( y ) 等于0或1,无论 Fy { y ) = 0还是 
^V(v) = !. 均有 /v(y) = 0 - O 

例 7d 设X为一非负连续随机变量，其密度函数为/,令 y = X"，计算 K 的 
密度函数 f Y (. y ). 

解：令 0(!E) = ：t n , 那么 

g- 1 (y) = v 1/n 


且 


^ {i 


= n y， 


利用定理 7.1， 可得 
当 n = 2时， 


fy { y ) = W /n ) 
fy ( y ) = 


这与例 7b 的结论是一致的（因 x > o). 


小 结 

一个随机变量X称 为连续 型的，如果存在一个0：的非负函数 /( 称为 密度函 
数)， 满足： 对于任一集合 S， 有 




如果 X 是连续型的,那么其分布函数 F 在 /( z ) 的连续点处可导，且 

连续型随机变童 A ： 的期望值定义 如下： 

E \ X ] = J xf ( x)dx 
对于任一函数3,有一个有用的恒 等式： 

E \ g { X )] = g ( x ) f ( x)dx 
正如离散型情形一样，随机变童 X 的方差定义为如下： 


Var ( X ) = E [( X - E [ X ]) 2 ] 

随机变童 A ： 称为服从区间 (0,6) 上 的均匀分布， 如果其密度函数为 
( 1 

a ^ z < b 


m- 


fe — o 
0 


其他 


其期望和方差分别是 

E[X] = ^ 琴 )= ^ 1 ! 

随机变量； C 称为服从参数为 / i 和 a 2 的正 态随机 变量，如果其密度函数为 


/(:) = 


y /2 na 


-(x- M ) a /2<T a 


可以证明 


ft = E [ X \ ff 2 = Var ( X ) 


如果 X 服从均值为 m 、 方差为^的正态分布，那么如下定义的 Z : 

Z =h 

a 

也是服从正态分布的随机变量，其均值为0,方差为 1. 这样的随机变童称为 标准正 
态随机变量.有关 X 的概率可以通过标准正态随机变量 Z 进行计算，而 Z 的分布 
函数可以通过査表 5.1 或从网站上得到. 

参数为 （ n , p ) 的二项分布，当 n 足够大时，可以近似为均值为 np , 方差为 
np(l - p ) 的正态分布. 

—个随机变量称为参数为 A 的指数随机变量，如果其密度函数为如下 形式： 
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fix) 


Ae -^ 

0 


x ^ 0 
其他 


其期望值和方差分 别为： 

E [ X ] = j Var ( X ) = -l 

一个只有指数随机变量才具有的重要性质是无记忆性，也即对于正数 s 和 t , 有 


P{X > a + t|X > t } = P{X > a ] 

如果 X 表示某个零件的寿命，那么无记忆性就说明了对任意 年龄为 t 的零件的 
剩余寿命同一个新的零件的寿命的分布是一样的. 

令 X 为一个非负连续型随机变量，其分布函数为密度函数为/,那么函数 


A(t) = 


/⑷ 

"TF(tj 


i >0 


称为 F 的危险牟函数，或者失效车 函数. 如果我们认为 X 是某个零件的寿命，那 
么对于一个很小的值出, a ⑴ dt 远似为年龄为 t 的零件在 dt 时间内会失效的概率. 
如果 F 是参数为 A 的指数分布，那么 

A ( t ) = A t > 0 

另外，指数分布是唯一的失效率为常数的分布. 

一个随机变 ft 称为参数为 （ a , a ) 的 r 随机变童，如果其密度函数等于 

-一胃 ― 1 … 


/(*) = 


r ⑷ 


_1 di 


r ( a ) 称为 r 函数，定义为 

r(a)= i 

r 随机变量的期望和方差分别 如下： 

E [ X ] = j Var ( X ) =; 

随机变量称为服从参数为 （ a , 6) 的 /3 分布，如果其密度函数为 


B ( a , b ) = 


x a - 1 ( l - x) b ~ 1 dx 


常数 S ( o ,6) 的定义 如下: 
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P 随机变童的期望和方差分别为 

E [ X ] = Var ( X ) = 


(o + 6 ) 2 (a + 6+ l ) 


题 


1.令； C 是一随机变量，其密度函数为 


{ C(l - I s ) -1 < I < 1 

0 其他 

( a ) C 的值是多少？ （ b ) 求 X 的分布函数. 

2. —个系统由一个元件和它的替换元件组成，若这个元件的寿命为随机变量 X , X 的密度函 
数由下式给出（单位为 月)： 

[ Cxe~ x/a x >0 

lo x<0 


/(*) = 


问这个系统能维持 5 个月的槪率有多大？ 

3. 考虑函数 

1 C (2 x -I 3 ) 0< i < § 
0 其他 


/(*) = 


f 能是一个槪率密度函数么？如果是，求 C •如果 /( a ：) 为如下的函数呢？ 
/(*) = 


1 C { 2 x - x 2 ) 0<®< 1 
0 其他 


4. 设随机变量 X 表示某个电子设备的寿命（单位：小时)，其密度函败 如下： 

i> 10 

x ^ 10 


/(*) = 




( a ) 求 P{X > 20}; ( b ) X 的分布函数是什么？ 

( C ) 6个类似的设备中，至少有三个寿命超过15小时的概率是多大？其中作了什么假设？ 

. 一个加油站每周补给—次油 • 如果它每周的销售量（单位：千加仑）为一随机变童，其密度 

函数为 . 

I 5(1 - 1 ) 4 0< x < 1 

/(*) = { 憾 

[o 其他 

试问油罐需要多大，才能把一周内断油的概率控制为 0-01? 
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6. 如果 X 的密度函数如下，求 E[X ]： 
*-* /a x >0 

其他 （ 


⑷ /(*) = 


4 16 


Jc ( l - x a ) 


— 1 < X < 1 

其他 


( c ) f ( x ) 



x > 5 
* < 5 


7 . X 的概率密度函数 如下： 

/⑻ 

如果 E [ X ] = §，求 a 和 6. 

8. 某种电子管的使用寿命（单 位： 小时）是一个随机变置，其密度函数为 


a + bx 2 0 < x 矣 1 
0 其他 


/(*) = xe~ x x ^ 0 


求电子管的寿命的期望值. 

9. 考虑第4章的例 4 b , 但现在假设季度需求最为一连续型随机变量，其密度函数为/,柑出 
最优储存鼉/应满足下面的 条件： 


其中6是每个单位销售量的利润， f 是每一个未销售单位的损失， F 是每季需求量的分布 
函数. 

10. 从早上7点开始，每隔15分钟都有一趙列车开往 A 地，而从7:05开始，每隔15分钟有 

-趙列 车开往 B 地. 

( a ) 如果某位乘客到达车站的时间服从在7点到8点之间的均匀分布.他到达车站以后， 
无论下 一 趙进站的是开往 A 地还是开往 B 的，他立刻上那一列车.问他乘上开往 A 
地的列车的概率是多大？ 

( b ) 如果该乘客达到达车站的时间服从7:10到8:10之间的均匀分布呢？ 

11. 从长为 L 的线段上随机 选点， 计算短的那•截相对于长的那-截的比例小于1/4的概 
率. 

12. —辆长途汽车运行在相距100英里的 A 和 B 两城市之间.如果汽车抛锚的话，抛锚地点 
距 A 的距离应该服从 （0, 100) 的均匀分布.又已知共有三个汽车服务站，分别设在城市 
A 、 城市 B 以及两城之间的中点.有人建议这三个服务站应该分别设在离城市 A 距离25, 
50, 75英里处，这样的设置效率更高，你同意吗？为什么？ 

13. 你于10点到达公共汽车站，并且己知汽车到达的时间在10点和10点半之间均匀 分布. 

( a ) 你等待时间超过10分钟的概率是多大？ 

( b ) 如果10:15时,汽车还没有来，那么你至少还要等待10分钟的概率是多大？ 

14. 令 A ■为 （0, 1) 上均匀随机变量，利用命题 2.1 计算 E [ X n l 并利用期望的定义验证该结 
论. 

15. 如果 X 为服从参数为 m = 10和 < r 2 = 36的正态随机变量，求 
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(a) P{X > 5>; (b) P{4 < X < 16} ; (c) P{X < 8} : 

(d) P{X < 20} : (e) P{X > 16}. 

16. 某个地区的年降雨量（单 位： 英寸）服从参数为 M = 40和 tr = 4的正态分布.那么从今年 
开始，10年以内，每年的降雨童不超过50英寸的概率有多大？你作了什么假设？ 

17. 某人向某个目标射击，如果击中目标1英寸范围内，那么获得10 分： 如果击中目标1英 

寸到3英寸之间，获得5分：如果果击中目标3英寸到5英寸之间，获得3分.如果击中 
点与靶心的距离服从 （0, 10) 上的均匀分布，求获得分数的期望值. • 

18. 假设 X 是一个正态随机变量，其均值为 5. 如果 P{X> 9} =0.2, 求方差的近似值. 

19•令 X 为一正态随机变量，均值为12,方差为 4. 求满足条件 P{X >c} = 0.10 的 c 值. 

20. 在某社区内，有 65% 的人支持提高教育税.如果随机抽取 100 人，估算以下亊件 概率： 

(a) 至少 50 人支持该建议； (b) 支持该建议的人在 60 人到 70 人（含）之间； 

(c) 少于 75 人支持该建议 • 

21. 假设25岁男人的身高（单 位： 英寸）是参数为 m = 71, = 6.25 的正态随机变*.那么 

身高超过6英尺2英寸的比例有多大？在身高皆超过6英尺的成人俱乐部里，身高超过6 
英尺5英寸的比例有多大？ 

22. 有一种锻造的铜铝合金零件，其上有一 开口. 开口宽度具有正态分布，期望 /x = 0.9( 英寸)， 
a = 0.003. 产品的工艺标准为 0.9000 ± 0.005. 

(a) 零件的废品率为多少？ 

(b) 若容许的废品率为 0.01, a 应控制在多大才能满足这个要求？ 

23. 掷-枚均匀骰子1000次，求点数6出现的次数在150到200次（含）之间的概率的近似 
值，如果点数6正好出现了 200次，求点败5出现的次数小于150次的概率. 

24. 某半导体工厂生产的计算机芯片的寿命服从正态分布，参数为 M = 1-4 x 10 6 小时 ， <r = 
3 x 10 s 小时.求一批 100 个芯片内，包含至少 20 个芯片，其寿命都小于 1.8 x 10 8 的概率 
的近似值. 

25. 某工厂生产的每个元件都以 0.95 的概率被接收，且各元件是否被接收是相互独立的（即不 
是成批接收).问下一批150个元件内最多10件不被接受的概率的近似值. 

26. 某工厂生产两种硬币，一种是均匀硬币，另一种在抛掷时正面朝上的概率为55%.现有一 
枚该工厂的硬币，但是不知道是 哪种. 为了确认是哪-种，我们进行如下统计 检验： 掷这 
枚硬币1000次，如果正面朝上的次数超过525次（含)，那么我们认为该硬币不是均匀的， 
否则，就认为它是均匀的.如果该硬币确实是均匀的，我们将会得到错误结论的概率是多 
大？如果该硬币不是均匀的呢？ 

27. 在10 000次独立地掷硬币过程中，如果正面朝上的次数超过5800次，那么有理由认为这 
枚硬币不是均匀的.试解释之. 

28. 人群中有12%的人为左擻子，估算在一个有200人的学校中，左擞子人数超过 2 0的概率 
的近似值.在这个问题中，你作了什么样的假设？ 

29. 某股价波动模型认为，如果目前的股价为 s , 那么一个周期后，股价变成 us 的概率为 P , 变 
成 ds 的概率为1 - P . 假设各周期的股价波动是相互独立的，试估算未来1000个周期后, 
股价上涨30%的概率，其中 u = 1012, d = 0.990, p = 0.52. 
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30. 一个存储部件分为两个区域，白区和黑区.当随机地从白区读取数据，所得到的数据长度 
可用一个正态随机变量表示，其期望 /* = 4,方差为 ^ = 4. 当随机地从黑区读取数据，所 
得到的数据长度的参数为 /i = 6,<7 a = 9. 现在随机地从存储器读取一个数据，其长度为 5. 
现设黑区所占的比例为 o . 当我们取得数据长度为5时，说数据来自白区，或黑区，都会有 
一定的犯错误概率.当 a 多大时，两种犯错误的概率一样大？ 

31. ( a ) 某救火站设在一段长为 A A < oo 的 路上. 如果着火点均匀分布在区间 （0, A ) 上，那 

么救火站应该设在何处，使得到着火点的期望距离 最小. 也即，计算 a , 使得 E [| X - a |) 
达到最小值,其中 a : € (0,>1)为着火点. 

( b ) 现假设该段路的长度为无限长一从原点0 -直延伸到 oo , 如果着火点距离原点的距 
离 X 服从参数为 A 的报数分布,那么救火站应该设在何处,如果我们要使得 £[| X - o |] 
极小化？ 

32. 修理某机器所需的时间（单 位： 小时）是参数为 A = 1/2的指数随机变量，试问 

( a ) 修理时间超过2小时的概率是多大？ 

( b ) 若己持续修理了 9小时，总共需要10小时才能修好的概率是多大？ 

33. 收音机工作时间（单位 ：年） 服从参数为 A = 1/8的指数分布，琼斯买了一台收音机，问8 
年以后它仍能工作的概率是多大？ 

34. 琼斯估计，一辆汽车在报废之前能行驶的里程（单 位： 千英里）是以 A = 1/20为参数的指 
数随机变量，史密斯有一辆自称是只行驶过10 000英里的旧车，如果琼斯买下这辆汽车, 
按她的上述估计，至少还能行驶20 000英里的概率是多大？若将指数分布这一假设改为 
(0, 40) 上的均匀分布，上述概率又是多大？ 

35. 对于一个年鈴为 t 的男性吸烟者来说，患肺癌的危险率函数 A ( t ) 为 

A ( t ) = 0.027 + 0.000 25 (t - 40 ) a t ^ 40 


假定一个40岁的男性吸烟者没有患肺癌，那么他活到如下岁数仍不患肺癌的概率是多大？ 
( a ) 50岁.（1>)60岁. 

36. 假设某个元件的寿命分布的失效率函数为 m = t 3 , t > o . 求以下事件 概率： 

( a ) 寿命将超过2年： （ b > 寿命在 0.4 年到 1.4 年 之间： 

(c) 某个己经用了 1 年的元件，还能使用 1 年. 

37. 如果: V 服从 (-1,1) 上均匀分布，求 

( a ) P {| X |> i }; ( b ) 随机变量 W 的密度函数 • 

38•如果 y 服从 （0,5) 上的均匀分布，那么方程 4 x 2 + 4 a：y + y + 2 = 0的两个根都为实数的 
概率有多大？ 

39. 如果 X 是一个指数随机变量，其参数为 A = l , 求随机变量 y 的密度函数，其中 y = lnX . 

40. 如果 x 服从 （ o , 1) 上的均匀分布，求 y = e x 的密度函数 • 

41. 计算= Asid 0 的分布函数，其中 A 为 一 给定常数,》服从 (- n / 2 , n / 2 ) 上均匀分布.这 
样的随机变童出现在弹道学理论中 • 如果一枚炮弹从原点开始发射，仰角为 a ， 速度为 
v , 则命中点 K 可以表示为 ( w a / g )8 in 2 a ， 其中 s 为地球引力常数，等于米/秒 2 _ 
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理论习题 


1. 平衡状态的气体分子的速度 是-个 随机变量，其密度函数为 


/⑻ 


x>0 
0 i < 0 


其中6 = m/2kT, 和 m 分别表示波尔兹曼常数，绝对温度以及分子的质量.求常数 
a 的值. 

2. 证明： ^ ^ 

E[Y] = j°° P{Y> y}dy -乂 P{Y < -y}dy 

提示： 证明 


J P[Y < -y}dy = - J xfy(x)dx 
J P{Y > y}dy = J xfy (x)dx 


3. 如果 A ： 的密度函数为 /, 证明 

提示： 利用理论习题 2, 先从等式 

S[ff(i)]= r P{g(X) > y}dy - [°° P{g(X) < -y}dy 
Jo Jo 

开始，然后利用本书中当 g{X) > o 的情况下的证明方法继续下去. 

4. 证明推论 2.1. 

5. 对于一个非负随机变鼉 V ,有 

E[Y] = j: P{Y> t}dt 
利用此结论来 证明： 对于非负随机变董 X ,有 

E[X n ] = [°° nx n ~ 1 P{X>x}dx 

Jo 

A too 

E[X n ]= / P{X n > t}dt 
Jo 

开始，然后作变量替换 t = 

6. 定义 一 系列亊件 £ o ,0< a < 1, 满足： 对任意 a 有 P(E a ) = 1,但^(0^ 0 ) = 0. 
提示： 令 X 为 (0,1) 上均匀分布，利用 X 定义每个私. 



206 第 5 聿 连续型随权变量 


7■.称 

SD ( X ) = VVar ( X ) 

% X 的标 准差若 A " 的方差为 < r a ， 求 SD(aX + 6). 

8.令 X 为取值为0到 c 之间的随机变量，也即 P {0 ^ X < c } = 1, 证明： 

Var ( X ) ^ j 

提示： 先证明 



然后利用它证明 

Var ( X ) < c 2 [ a ( l - a)J 其中 a = 

9.设 Z 为标准正态随机变量， 证明： 对于 * > 0,有 

⑷ P{Z >x} = P{Z< -*}; ( b ) P{\Z\ > x } = 2 P{Z > *}; 

( c ) P{\Z\ < i } = 2 P{Z < i } - 1. 

10 •令 f(x) 表示参数为 / x 和的正态随机变量的密度函数，证明 / i - ff 和 /x + ff 为该函数 
的拐点，也即证明：当 * = /* — a 或 a : = (i + < T 时 f"(x) = 0. 

11. 令 Z 为标准正态随机变量， s 为可微函数，其导函数为 〆 . 

⑷证明 E[g'(Z)] = E[Zg(Z)] 

( b ) 证明 E [ Z " +, ] = nE[Z n - x ) 

( c ) 求 E[Z*) 

12 . 设 X 是参数为 A 的指数随机变量，利用理论习鹿5中的等式，求出 E[X 2 ]. 

13. 设某连续随机变量的分布函数为 R 则满足 F ( m ) = 1/2的 m 称为这个随机变量的中位 
数.也即，随机变量取值大于中位数的概率与取值小于中位数的概率是一样的.当随机变 
置 X 服从以下分布时，求其中 位数： 

( a ) 在 ( a , 6) 区间上均匀分布； （ b ) 参数为 m 和的正态 分布； 

( c ) 参数为 A 的指数分布 • 

14. 设随机变量的分布密度为/,使得 / Or ) 达到最大值的点称为它的众数.求以上理论习题 
13中的 （ a ), ( b ), ( c ) 里的随机变童的 众数； 

15. 如果 X 为参数为 A 的指数随机变*,对于 C > 0,证明 cX 服从参数为； V / C 的指数分布. 

16. 当 A ■服从 (0, a ) 上均匀分布时，求其危险率函数. 

17. 如果 X 的危险率函数为 Ax ⑴,计算 aA ： 的危险率函数，其中 a 为一正常数. 
is . 证明 r 分布的密度函数积分值为 1 . 

19. 如果 X 为均值为 1/ A 的指数随机 变量， 证明 

E[X k ) = ^ fc = l ，2，_. 

提示：利用 r 分布密度函数来计算. 



20. 证明: 
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Var ( X ) = § 

其中 X 为参数为 （ a , A ) 的 r 分布随机变量. 

21 . 证明 r ( i ) = y / H . 

提示： r ( i ) = e -^ x -^ dx , 做变量替换 y = v /2 i , 然后将结果与正态分布联系起来 • 

22. 求参数为 （ a , A ) 的 r 分布随机变量的危险率函数，并证明当 a > 1时危险率函数递增， 
而矣1时递减 • 

23. 求威布尔随机变量的危险率函数，并证明当;3 > 1时递增，而 < 1时递减. 

24. 如果 F (.) 为威布尔分布函数，指出 ln ( ln(l - F ( x ))- 1 ) 对于 In a : 是一条斜率为泛的直 
线.且证明，当《/ = 0 时，大约 63.2% 的观测值都将小于 a . 

25. 令 

证明 ：如果 x 是服从参数为 u , a ,0 的成布尔分布的随机变量，那么 y 就是服从参数为 
A = 1的指数随机变量，反之也成立. 

26. 如果 X 是服从参数为 （ a , b ) 的0 分布的随机变量，证明： 

^ = ^6轉) 、刪二 +1) 

27. 如果 X 服从 ( a , b ) 上的均匀分布，那么和 X 有线性关系，且服从 (0,1) 上均匀分布的随 
机变量是什么？ 

28. 考虑参数为 （ a , 6) 的办分布，证明 

( a ) 当 a > 1和6 > 1时，密度函数为单众数（即密度函数只有一个众数)，其众数为 
(o - l)/(a + 6 — 2); 

( b ) 如果《»<1,6<1,且(1 + 6<2,那么密度函数或者是单众数的，此时众数为0或1, 
或者为 U 型函数 ， 0和1都是 众数； 

( c ) 当 a = 1 = J •时， [0, lj 上所有点都是众数. 

29. 设 X 为连续型随机变鼇，其分布函数为 F . 定义随机变量 Y：Y = F ( X ). 证明： /服从 
(0,1) 上的均匀分布 • 

30. 设； f 的密度函数为 / x , 求随机变霣 y 的概率密度函数，其中 y = aX + b . 

31 . 设； C 为服从参数为 M 和^的正态随机变量，求 y = e x 的密度函数.随 机变量 Y 称为 
服从参数为 ^ 和 ff 2 的对数正态（因为 lnV 服从正态分布）随机变量. 

32. 令； f 和 V 为相互独立的随机变最，它们都在 1,2,. ,10 N 上等可能取值，其中 W 是一 
个足够大的数.令 D 表示 X 和 Y 的最大公约数，且令 Q * = P{D = k }. 

( a ) 用直观的方法论证 Q * = 

提示： 注意到要使得 D 等千 k , k 一定要同时整除 X 和 I 且 X / A : 和 K / fc 要互素 
(即两数的最大公约数为 1). 
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( b ) 利用 （ a ), 证明 

和 Y 互素} = 

E"* a 

fc=i 

根据著名的等式 5： J ° 1/ fc 2 = « 2 /6,因此 Qi = 6/ J 1 2 . (在数论里，这就是著名的勒让 
德定理 .） 

( c ) 证明 

Qi 

其中《是大于1的第 i 个最小的索数. 

提示： X 和 y 互素的条件是它们没有公共的素因子，因此,利用 （ b ), 可以看出 

这点在第4章的习题11中提及过.（本題与第4章习题11之间的关系就是， A ： 和 Y 
互索的条件是 A ■和 K 没有公共的索因子 .） 

33.当 g(x) 是递减函数时，证明定理 7.1. 

自检习题 

1. 某高中篮球队员在随机挑的一场篮球比赛中的上场时间是一个随机变量，其概率密度函 
数如下图 给出： 

0.050 1 I-1 

0.025 | - ' 1 -1 


10 20 30 


㈣ 


求以下亊件 概率： 

( a ) 上场时间超过15 分钟； （ b ) 上场时间在20到35分钟之间； 
( c ) 上场时间小于30分钟； ( d ) 上场时间超过36分钟. 

2. 随机变貴 X 的密度函数为 

f cx n 0 < x < 1 


/(*) = 


lo 


其他 


其中 c 为常数，计算 （ a ) c , ( b ) P{X > *},0 < x < 1. 

3. 随机变量 A " 的概率密度函数为 

f or 4 0 < a : < 2 


/(*) = 


lo 其他 


其中 c 为常数，计算 （ a ) E[X), ( b ) Var ( X ). 



4. 随机变量 X 的概率密度函数为 
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m 


ax + bx 2 
0 


0<®<1 

其他 


如果 E [ X ] = 0.6, 计算⑷ P { X < 1/2}, ( b ) Var ( X ). 

5. 随机变量； t 称为取值为整数1,2,••- , n 的离散型均匀分布的随机变量，如果 
P{X = *} = 1 /n i = 1,2, - ,n 


对于任意非负 实数: r , 记 Int ( i )( 有时也记为【*])为不超过 a ： 的最大整数.如果 U 是一 
个服从 (0,1) 上的均匀分布的随机变量，证明 X = Int ( nU ) + 1为取值为1,2,…， n 的 
离散型均匀分布的随机变量 • 

6. 在某个竞标工程里，你们公司将要做出 竞价. 如果你贏得了这个合约（出价最低)，那么你 
计划还要付出 100( 单位： 千美元）完成这个工程.如果你认为其他竞标者的最低竞价服 
从 （70,140) 上的均匀分布，那么你应该出价多少使得你的期望贏利最大？ 

7. 在如下游戏中，你为了取胜，需要连续胜3 局. 该游戏决定于一个 （0,1) 上均匀分布的值， 
如果 {/ > 0.1，那么你第1局获胜；如果 C / > 0.2, 那么你第二局 获胜； 如果1/ > 0.3,那 
么你第三局获胜. 

( a ) 计算贏得第-局的概串； 

( b ) 计算贏得第一局的条件下，贏得第 二 局的条件概率： 

( c ) 计算贏得第一局和第二局的条件下，贏得第三局的条件概率； 

( d ) 计算你最后获胜的概率. 

8 . 随机选中的-名参加 IQ 测试者得到的智商值近似服从均值为100,标准差为15的正态 
分布.求以下亊件 概率： 

( a ) 该测试者的智商值在125以上； （ b ) 该测试者的智商值在90到110之间. 

9. 假设从您家到办公室所要花费时间服从均值为40分钟,标准差为 7 分钟的正态 分布如 
果你要参加-个下午1点的约会，地点就在办公室，那么要想做到95%的把握不迟到，那 
么最晚何时出发？ 

10. 某汽车轮胎的寿命服从均值为34 000英里，标准差为4000英里的正态分布. 

( a ) 该轮胎寿命超过40 000英里的 概率； 

( b ) 该轮胎的寿命在30 000到35 000英里的 概率； 

( c ) 在该轮胎已经行驶了 30 000英里的条件下，那么还能行驶10 000英里的条件概率是 
多大？ 

11. 俄亥俄州克利夫兰市的年降雨量近似为均值为 40 2 英寸，标准差为 8 4 英寸的正态随机 
变量.求以下事件 概率： 

( a ) 下一年降雨量超过44 英寸； 

( b ) 接下来的7年中，正好有3年的降雨量超过44英寸 • 

假定 A „ i ^ l 相互独立，其中 人表示 “接下来的第 i 年的降雨量超过44英寸”. 
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12. 下表是1992年男女职工的收入表: 


收入范围 

女性百分比 

男性百分比 

$9999 

8.6 

4.4 

10 000~19 999 

38.0 

21.1 

20 000~24 999 

19.4 

15.8 

25 000 〜 49 999 

29.2 

41.5 

>50 000 

4.8 

17.2 


考虑随机抽取200个男职工和200个女职工，估算以下概率的近 似值： 

( a ) 至少70个女职工的收入超过25 000: ( b ) 至少60%的男职工收入超过25 000； 

( b ) 至少3/4的男职工和至少一半的女职工收入超过20 000. 

13. 在某个银行,顾客办理业务的时间的长度服从均值为5分钟的指数分布，如果你走进银行 
时，正好有一个顾客在办理业务，问他或她还要再办理4分钟的概率是多大？ 

14. 假设随机变量的分布函数 如下： 

F ( x ) = 1 — e - ** * > 0 

求： 

( a ) P [ X > 2 } ; ( b ) P {1< X <3}; ( c)F 的危险率 函数； 

⑷ E [ X ]-, ⑷ Var ( X ). 

提示： （ d ) 和 （ e ) 需要利用理论习题 5 的结论. 

15. 洗衣机工作的时间是一个随机变置（单 位： 年)，其失效率函数 如下： 

{ 0.2 0 < t < 2 

0.2 + 0.3 (t - 2) 2彡 t < 5 
1.1 t >5 

( a ) 购买 6 年后，洗衣机仍能正常工作的概率是多大： 

( b ) 在购买6年后，洗衣机接下来2年内会损坏的概率是多大？ 

10 . 标准柯西分布随机变量的概率密度函数为 

/(X) = ^ TT ^) -°° <a!<00 

如果； t 为标准柯西随机变量，证明 1/ X 也是标准柯西随机变量. 

1 T . 轮盘赌有38个下注区，分别标有0, 00, 1到 36. 如果你押1元在某个数字上，那么当轮 
盘停在该数字上时，你能贏得35元,否则就输掉这 i 元.如果你连续进行这样的下注，求 
以下概率的近 似值： 

( a ) 在34次下注后，您总的来说是获利的： 

( b ) 在1000次下注后，您总的来说是获利的： 

( c ) 在100 000次下注后，您总的来说是获利的. 
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假定每次轮盘转动以后，将等概率地停留在这38个可能的注区上. 

18. 箱子里有两种电池，第 i 种使用的时间 分别* 从参数为 Ai ,<= l ,2 的指数 分布. 随机地 

从中取一个电池， 取到第 i 种的概率为 P< , = 1. 如果随机取出的一个电池使用 t 

小时后仍正常使用，那么它还能继续使用 s 小时的概率是多大？ 

19. 涉及犯罪嫌疑人的证据是一个随机变童 X . X 为一指数型随机变量，其均值为若该 
人无罪，则 M = 1,否则 M = 2. 法官按下列方式 判罪： 当 X > c 时判有罪，否则判无罪. 

( a ) 法官希望以95%的把裡不冤枉一个无罪的人， C 应该取多少？ 

( b ) 利用 （ a ) 中得到的 C 值，计算将一个确实有罪的被告判为有罪的概率. 

20. 对任何实数 y , 定义 


⑷证明 E [( Z - c ) + ] = -^ e - eJ / 2 - c < l - *( C )), 其中 Z 为标准正态随机变量. 
( b ) 求 E [( X - c ) + ], 其中/为正态随机变量，均值为 / i , 方差为 〆 . 



第 6 章随机变量的联合分布 

6.1 联合分布函数 

到现在为止，我们仅仅探讨了单一随机变量的概率分布，然而，我们经常还对 
两个或两个以上的的随机变量的有关概率问題感兴趣_为了处理类似问题,我们定 
义任意两个随机变童■和 Y 的联合分布函數 (joint cummulative probability distri ¬ 
bution function ) 如下： 

F(a, b) = P{X < o , F ^ 6 } - oo < a,b < oo 

x 的分布可以通过 x 和 y 的联合分布 得到： 

Fx ( a ) = P{X < o } = P{X < oo } 

= P ( Um{X ^a,Y^b}) = 6 Um P{X^a,Y ^b) 

=^lim F ( o , b) = F(a, oo ) 

读者会注意到，在上述一系列等式里，我们又一次用到了概率是一个连续的集（事 
件）函数这一事实.类似, y 的分布函数 如下： 

Fy ( 6 ) = P{Y < b } = F ( a , 6 ) 三 F(oo,b) 

分布函数 Fx 和 Fy 称为 X 和 K 的边缘分布 (marginal distribution ). 

理论上,所有有关 A ■和 y 的概率问题都可以通过其联合分布函数来解决.比 
如，如果需要知道 X >a 和 Y >b 的联合概率，那么可以如下 计算： 

P{X > a, y > 6} = 1 - P({X > a, y > 6} c ) 

=1 - P({X > a} c U {K > 6 } c ) = 1 - P({X < a } U {r ^ 6 }) 
=1 - [P{X $ a } + P{Y < 6 }- P{X ^a,Y ^b}] 

= 1-F x (a)-Fy(6) + F(a,6) (1.1) 

公式 （ 1 . 1 ) 是以下公式（证明留作习题）的 特例： 

P{oj < X ( 02 , b\ < V " < 62 } 

=F(o 2 , & 2) + F(ai,i>i) — F(ai ,62) - F(a2,6i) (1.2) 

其中 ai < 02,61 < 62 - 

当 X 和 y 都是离散型随机变量时， X 和^的联合分布列 (joint probability 
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mass function ) 可以这样方便地定义： 

P(x,y) = P{X = x,Y = y } 
通过 p ( x , y ) 可以得到 X 的分 布列： 

px ( x ) = P{x = x }= ^2 p ( x , y ) 

yp(x,y)>0 


类似地， 

Py(v) = 5 Z P( z ， y) 

* ： p(*.»)>o 

例 la 坛子里有 3 个红球 , 4 个白球，及 5 个蓝球，从中随机取3个球.令 X 
和7分别表示取出的红球数和白球数，那么 A •和 y 的联合分布列 p ( t , j ) = P{X = 
i,Y = j } 计算如下: 


刺-©/©:盖 
齡謹盖 

»('.») = ©©/( a ) ^ 
啦 ) = 0®/® = 盖 

沿 ,”=©(»/(?) = 1 


劍 = ©■ = 晶 
_ = ©/(?) =- 

齡®® / ft 2 )=^ 
- p .»>=©/( 3 2 )^ 


这些概率也可简单表示成表 6.1 的形式.读者会注意到， X 的分布列可以对行 
求和得到，而 y 的分布列可以通过对列求和得到.既然 a •和 y 各自的分布列都 
出现在这样表格的边缘，因此,它们又常常分别称为 x 和 y 的的边缘分布列. ■ 


表 6.1 P{X =i,Y =j} 



0 

1 

2 

3 

行和： P{X = »} 

0 

10 

220 

40 

220 

30 

220 

4 

220 

84 

220 

1 

30 

220 

60 

2 ^ 

18 

220 

0 

108 

220 

*2 

15 

220 

12 

220 

0 

° 

27 

220 

3 

1 

2 M 

0 

0 

° 

1 

220 

列和： p{y = i} 

56 

220 

112 

220 

48 

220 

4 

2 W 
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例 lb 假设某个社区内，15%的家庭没有小孩，20%的家庭有一个小孩，35% 
的家庭有两个小孩, 30%的家庭有3个小孩.而且，进一步假定每个家庭里的每个 
孩子为男孩或女孩的可能性是一样的（且独 立). 如果从这个社区内随机抽取一个 
家庭，令 S 表示这个家庭的男孩数，令 G 表示该家庭里女孩数，那么它们的联合分 
布列如表 6.2 所示. 

由这些概率 得到： 

P{B = 0, G = 0} = P { 没有孩子} = 0.15 

P{B = 0 ,G = 1} = P {1 个孩子且为女孩} 

= P{1 个孩子 }P{1 个女孩 |1 个孩子 } = 0.20 x | 


P{B = 0,G = 2} = P{ 2个孩子且都为女孩 } 

= P { 2 个孩子 } P {2 个女孩|2个孩子 } = 0.35 x (^) 2 
表 6.2 中其余概率的验证留给读者. 



表 6.2 

P{B = 

= i,G = j} 




0 

1 

2 

3 

行和. P{B = t> 

0 

0.15 

0.10 

0.0875 

0.0375 

0.3750 

1 

0.10 

0.176 

0.1125 

0 

0.3875 

2 

0.0875 

0.1125 

0 

0 

0.2000 

3 

0.0375 

0 

0 

0 

0.0375 

列和： P[G = j) 

0.3750 

0.3875 

0.2000 

0.0375 



我们称 X 和 y 是联合连续 (jointly continuous ) 的，如果存在一个对任意 a ：, y 
定义的函数 f(x,y), 有以下 性质： 对任意实数对集合 C (也即 C 是两维空间里的集 


P {( X , K) e C} = jj f(x ， y、dxdy (1.3) 

(*，W)GC 

函数 /( i , y ) 称为 A ■和 的 联合密度函数 (joint probability density function ). 如果 
yl 和 S 为任意实数集,定义 C 7 = {( x , i /) :xeA,y€B}, 通过公式 （1.3) 可以 看出： 

P{X &A,Y€B}= f f f(x,y)dxdy (1.4) 

JbJa 

因为 b a 

F{a,b) = P{X € {-oo,a),Y e (-oo,6)} = / / f(x,y)dxdy 

J —oo J —oo 

只要偏导数有定义就 可得： 
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可以从另一个角度来理解连续密度函数的定义，利用 （1.4) 式，可得到公式 

疒 6+db «*a+da 

P{o < X < a + da, b<Y <b + d6} = / / f(x,y)dxdy m f(a, b) da d6 

其中 da 和 d6 很小，且 f(x,y)tE. (a,b) 处连续.因此, f(a,b) 表示为随机向 *： (X,Y) 
取值于 (a, 6) 附近的可能性. 

如果X和 y 为联合连续的，则它们各自都连续.它们各自的密度函数可以如 
下 得到： ^ 

P{X e i4} = P{X eA,Ye (- 00 , 00 )} = f f f(x,y)dydx= f f x (x)dx 

JaJ-oo Ja 

其中 

r°° 

fx(x) = J f{x,y)dy 


是 A： 的密度函数.类似地， y 的密度函数 如下： 

fv[y)= f f(x,y)Ax 


例 ic 设 a • 和 y 的联合密度函 数为： 

! 2e~ x e~ 2y 0 < x < oo,0 < y < c 
0 其他 


f(x,y )= 


计算 ：（a) P{X >l,y<l>; (b) P{X<Y)-, (c) P{X < a}. 

解：⑷ 

P{X>1 ， Y<1} = ( J^° 2e~ x e~ 2y dxdy 

= f 1 2e -aw (-e-*|~) dy = e _1 f 2e~ 2v dy = e~ 1 (l-e- 2 ) 

Jo Jo 

(b) 

P{X < y} = JJ 2e~ x e~ 2v dxdy = J 2e~ x e~ 2v dxdy 

(x,y)：x<y 

= 厂 2e- 2 »(l - e~ v )dy= f°° 2e~ 2y dy - f 2e~ 3y dy =« 1 - | ^ 


P{X < a} = J J 2e~ 2v e~ x dydx = J e~ x da: = 1 - e -a 
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图 6.1 联合概率分布 


例 Id 考虑一个半径为 fl 的圆，按 
如下方式随机从圆内选 一点： 落在圆内任 
—区域内的概率只与这个区域的面积有 
关，与该区域在圆内位置无关（也即该点 
在圆内服从均匀分布).如果令圆心表示 
原点，且令 A •和 y 表示该点的坐标（如 
图 6.1) .既然 ( X , Y ) 落在圆内任一点附 
近的概率都是一样的， A •和 F 的联合密 
度函数为 

, (c 如果 a : 2 + y 2 彡 J ? 2 
f ( x , y ) = \ 

[0 如果 z 2 + y 2 > i ? 2 


( a ) 求常数 c ; ( b ) 计算 X 和 y 的边缘密度 函数； 

( c ) 求原点到该点的距离£>小于等于 a 的 概率； ⑷计算 E [ D }. 


解： （ a ) 利用密度的性质 




f ( x , y)dydx = 1 


可得 


JJ dydx = 


我们可以利用极坐标计算 ff x 2 + y ^ dydx 的值.也可以用更简单的办法，注意到 
它表示的就是半径为的圆的面杂，因此等于 JiH 2 , 从而 

C= — 


( b ) 


Mx)= S j^ iv= ^ L^ dy 

= ^ fj y 其中 
= -^y/R 2 -x 2 x 2 ^r 2 

当 a : 2 > fl 2 时,它等于 o . 利用对称性可知， y 的边缘密度为 

y 2 ^ R2 

fy(v) = { nI ^ 

[0 y 2 > R 2 

( C ) 原点到该点的距离 d = vx 2 + r 2 的分布函数可以如下得到，对于0 < 



a 彡 fi， 有 
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巧⑷ = P{y/X 2 + Y 2 <a} = P{X 2 + y 2 <a 2 } 

JJ f(x, y) dy dx - JJ dydx 


na 2 _ a 2 
: = ^2 


* 2 +!/ 2 < o 2 x 2 + y 2 《 a 2 

其中用到了事实 Jf x3+yHa3 dydx 为半径为 a 的圆的面积,其值为: m 2 . 


(d) 从以上 （c) 可以得到 D 的密度函数为 


因此， 


/。⑷= 


a 2 da 


2R 

"T 


例 le X 和 y 的联合密度为 

{ e -(*+») 
0 

求随机变童 X/Y 的密度函数. 


0 < * < oo, 0 < y < 00 

其他 


解： 先来计算 X / Y 的分布函数.对于 a > 0,有 
Fx/Y(o) = 《 a、 = jj e _(l+v) da:di/= J j e -( * +w) dx dy 

i/»<a 

= 厂 (1 - e ” = {- e ' v+ ^^rrlir = 1 "^tt 

对 F x / Y ( a ) 求导可得到 X / Y 的密度函数 / x/y ⑷ = l/(a + 1) 2 ,0 < a < oo . ■ 

我们也可以用和 n = 2 时同样的方法定义 n 个随机变量的联合分布.比如 ， n 
个随机变量 X U X 2 、 …， X n 的联合分布函数定义为 

F(ai ， d2, … ， an) = P{Xi < ai,X2 《勿， … ,X n < a n } 

而且， X u -- , X n 称为联合连续的，如果存在一个函数 /( xi ,--, x n ), 对于 ri 维空 
间里的任意集合满足下列 条件： 

P {{ X U X 2 ，…， X n ) e C } = J J" … J f ( xi , …， xjdxidxz ". dx n 

(®i, … ,x n )ec 

f ( Xl ," .， cr „) 称为 …， X n 的联合密度 函数. 特别，对于 n 个实数集七,也，…,>1„， 
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有 


p{X! e A lt x 3 e a 2i -■ ■ ,x n € A n } 

= / / ••- / - ,Xn)<iCldl2 -din 

J A n J A n -\ JAi 

例 If (多项分布）多项分布是很重要的联合分布之一，它经常出现在进行 n 
次独立重复试验当中.假设每次试验都有 r 种可能结果，各自概率分别为 Pl , P 2, -, 
Pr ， Ei=lPi = 1,令 兄表示 n 次试验中第 i 个结果出现的次数,那么 

P{_Xi = ni , X2 = n 2 , •• - ,Ar = n r } = ni ! n2 ?:.. n fPi ' P ^ … P? r (1-5) 
其中 m=i TH = n,rii^ 0,i = 1, ••- ,r. 

现在来解释 (1.5) 式.记 n 次试验结果为 ••,*«), 其中0取值于 {1, 2,…， 
r } (这里我们记数字 i 表示第 i 种结果 i =!_,••• , rO , 表示第 j 次试验的试验结果. 
^ 中有 m 个1,…， rv 个 r , 则由试验的独立性可知 

P{(iir - ,in))=Pi' -Pr r 
事件 { Xi = m , ••- ,Xr=nr} 可作如下 分解： 

{Xl = Til,... ,X r = T»r} = U{(“ ， … I*n)} 

其中事件求和号是表示对一切 (*!,•••,»„) 求和,其中 （ i !, … ， i „) 中有 m 个1，…， 
n T •个 》•. 利用概率的性质可知 

P{Xi = ni ， … , X r = n r } = 5^ P {( ti , - , in )} = ^2 Pi' … P? r 
显然求和的项数为 n !/( m ! - rv !). 这样，我们得到 （1.5) 式.以 （1.5) 式为联合分 
布列的联合分布称为多項 分布. 注意，当 r *=2 时，多项分布就退化为二项分布 • 

再次说明，对 {X 1 ,X 2 , -- ,X r } 的任何子集求和，这个和都具有二项分布•也 
就是说，若 AT C {1,2, …， r }, 则将是二项随机变置，参数为 n 和 P = 
Z ieN p i - 这是因为 E ieN x i 表示 n 次试验中，结果属于#的试验次数，每个试 
验独立且出现这个结果的概率是 

作为多项分布的应用，考虑掷一枚均匀的骰子 9 次，那么1出现3次， 2 和3 
各出现2次, 4和5各出现1次，6不出现的概率为 

3!2I2!l!lT6!Q 3 Q 2 Q 2 Q 1 (B) 1 G) 0 = alfW© 9 ■ 


6.2 独立随机变量 

随机变量 A ■和 称为 独立的 ( independent ), 如果对任意两个实数集>1和 
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P{X e^y € B } = P{Xe A } P{Y € B } (2.1) 

也就是说，如果对所有的4和 B ， 事件= {X e 4} 和= {F e 是独立 
的，那么随机变量 x 和 y 独立 • 

利用概率的三条公理可知，公式 (2.1) 成立当且仅当对所有 a , 6,有 
P{X ^ a,y <6} = P { X < a } P{Y ^ 6} 

因此,利用 x 和 y 的联合分布函数 f , 我们有，如果 

尸(〜6) = /^0»)&(6) 对所有的 a , 6成立 
则； f 和 y 独立.当； f 和 F 为离散型随机变量时，独立的条件 (2.1) 等价于 

P(x,y) =Px(x)py{v) 对所有的 o ：， j / (2.2) 

上述结论成立是因为如果 （2.1) 成立，那么令4和 S 分别表示单点集4 = { a ;} 和 
B = { y }, (2.1) 式就变成了 (2.2) 式反之，如果 (2.2) 式成立，那么对任意集合 B , 
有 

P{X £ A,Y € B } = 53 ^ p ( x . y ) = 53 ^2 px ( x ) py { v ) 

yeBx€A y€BxeA 

= EP ^( w ) EP ^( I ) = P { y€ 5} P{X € A ) 

yGB x€A 

这样就证明了公式 (2.1) 式的成立. 

在； c , y 联合连续的情形下，独立的条件等价于 

f(x,y) = / x (*)/ v ( l /) 对所有的 ®，y 

因此,粗略地说，如果知道其中一个变量的取值并不影响另一个变童的分布，则 
两个变量就相互独立.不独立的随机变量称为 相依的 ( dpendent ). 

例 2 a 考虑进行 n + m 次独立重复试验，每次成功的概率为 P ， 如果 X 表示 
前 n 次试验成功的次数， y 表示后 m 次试验成功的次数，那么 X 和 F 是独立的， 
因为知道了前 n 次试验中成功的次数并不影响后 m 次试验中成功次数的分布（因 
为假设试验是独立的).事实上，对于整数 I 和 y , 有 
P{X = x,Y = y } 

= Qp*(l - p) m ~ v 0< a :< n ,0< y<m 

= P{X = x } P{Y = y } 

但是， A •和 Z 是相依的，其中 Z 表示在 r » + m 次试验中总的成功次数（为什 
么?) . ■ 
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例 2 b 假设某一天内进入邮局的人数为服从参数为 A 的泊松分布，证 明：如 
果每个进入邮局的人为男性的概率为 p , 为女性的概率为1 - p , 则进入邮局的男人 
数和女人数是相互独立的泊松随机变量，它们的参数分别为 Ap 和 A ( l - p ). 

解：令 x 和 y 分别表示进入邮局的男人数和女人数.为证明 a ■和 y 独立， 
只需证明 （2.2) 式成立.利用全概公式， 

P{X = i,Y = j } = P{X = i,Y = j\X + Y = i + j } P{X + Y = i + j } 

+ P{X = i,Y = j\X + Y ^i + j } P{X + Y ^ i + j } 

(读者应该注意到该公式仅仅是公式 P ( E ) = P ( E \ F ) P ( F ) + P (瓦的特 
例 .） 由于 P{X = i,Y = j\X + Yji i + j } 显然为0,我们可以得到 


P{X = i,Y = j } = P{X = i,Y = j\X + Y = i + j } P{X + y = z + i } (2.3) 
现在，因为 x + y 是进入邮局的总人数，根据假设 


P{X + Y = i + j }= e~ x 


X i+ i 

(<+ 7 )! 


(2.4) 


而且，在给定 i + j 人进入邮局的情况下，既然每个进入邮局的人为男性的概率为 
P , 因此, 正好有 i 个是男性（且正好有个女性）的概率 ( UpW - p )>, 即 


p{x = < > y=i|jc+r=*+j} = ( < + J ')p*(i - pY 


(2-5) 


将公式 （2.4) 和 （2.5) 代入式子 (2.3), 可得 

m — r -力 - C -咖-爲 

= (2 . 6) 

因此 

P{X = i }= e ~ Ap ^- H e ~ A(1 ~ p) P) ^ = e ~ Ap ^ T ' (2-7) 

类似地有 

P{Y = j } = e - A(1 * p) (2.8) 

(2.6) 式、 (2.7) 式和 （2.8) 式说明了所求结果. ■ 

例 2 c 某男和某女决定在某个地点见面.如果每个人到达的时间是独立的，且 
在中午12点到下午1点之间均匀分布，求先到的人需要等待10分钟以上的概率. 

解：令 a •和 y 分别表示该男和该女到达的时间，以分钟为单位，以中午12点 
为起点.那么 A •和是相互独立的随机变量，且均服从 (0,60) 上的均匀分布.所 
求概率为 p { x+io < y }+ F { y+io < x }. 根据对称性，它等于 2p { x +\ o < y ). 



如下 得到: 
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2 P{X + 10 < y} = 2 JJ f ( x , y)dxdy = 2 JJ fx ( x ) f Y { y)dxdy 

x+10<y *+10<v 

=2 £ l ' 10 (壶”均 =☆ 人、 - 叫 办 =■ ■ 

下面的例子是一个有关几何概率的古老问题.它首先由18世纪的博物学家蒲 
丰提出并解决，通常称为蒲丰投针问题. 

例 2 d (蒲丰投针问题）桌面上画着一些平行线，它们之间的距离都是 D , 向 
此桌面上随意投掷一长度为 L 的针，其中 L < D , 问此针与桌面上的某一根平行线 
相交的概率是多大（另一种可能是此针正好在某两条平行线之间)？ 

解： 从针的中点向距离该点最近的一 
条平行线引一条垂直线，设这条垂线的长 
度为 X . 又设针与这条垂直线的夹角为 0. 

这样，垂直线、平行线以及针所在直线会 
形成一个直角三角形（见图 6.2). 如果直 
角三角形的斜边长小于 172 时，针会与这 
一条直线相交.也即，若 

•或 X <^ CO 80 

则针与这一条平行线相交.注意 X 是一个取值于0到 D /2 之间的随机变量， 
6 是一个取值在0到 n /2 之间的随机 变量. 关于 X 和&很自然地假定它们是相 
互独立的，并且在各自取值范围内均匀 分布. 因此 

p|x < ^cos^j = JJ fx(x)fe(y)dxdy 

X < L /2 coay 

4 /-"/a /- I -/2 COBV 4 卜 2 L 2 L 

= HdJ 0 l ㈣ = 产 ㈣ ■ 

例 2 e (正态分布的特征）令 A ■和 y 分别表示子弹的弹着点与粑心目标的水 
平和竖直偏差，且假设 

1. X 和 F 为具有可微密度函数的独立的连续随机变量； 

2. A •和 y 的联合密度 f ( x , y ) = / x ( ar )/ y ( I /) 作为 ( x , y ) 的函数只依赖 x 2 + j / 2 
的值 • 

更直观地说来，第2个假设说明了子弹落在: r - y 平面的概率取决于弹着点与 
目标点的距离，而与弹着点相对于目标的方位无关•第 2 个假设的另一个等价的说 
法是联合密度函数相对于旋转是不变的 • 

下面的说法是令人感兴 趣的： 由上述两个假设可推得 x 和 y 为正态随机变 
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量.为了证明这点，首先注意到由假设可得 

f ( x , y ) = fx ( x ) f Y { y ) = g ( x 2 + y 2 ) (2.9) 

(2.9) 式两边对 a : 求导,可得 

f'x Mfy ( v ) = 2 xg '( x 1 + y 2 ) (2.10) 

用式 (2.9) 去除 (2.10), 得到 

f ' xix ) = 2 xg , { x 2 + y 2 ) 
fx ( x ) ~ g { x 2 + y 2 ) 

fx ( x ) _ g '( x 2 + y a ) 

2 xf x ( x ) - »(*> + y 2 ) ^ ； 

(2.11) 式的左边仅与 a : 有关，而 （2.11) 式的右边仅与 x 2 + j / 2 有关.由此可以 
推出左边对任意 X 来说都是等值的.为了证明这点，考虑任意: TUZ 2, 取使 
其满足条件 x \ + y\=xl + yl 那么，从 (2.11) 式可得 

f’A 工 1) _ ^(^1 + vi) = 9"{.A + vl) = f'x^i) 

2 ii / x ( xi ) - g { x \+ y \) ~ g ( x \-¥ yl ) ~ 2® 2 / x ( xa ) 

因此， , 

/ x (^) 或 4 -fin fx ( x )) — cx 


^ r c 或石 


对两边积分可得 


In /欠■或 / x ( x ) = fce - 2 / 2 
由于 /，oo fx ( x)dx = 1, C 必然为负数，可将 C 写成 C = - 1/« T 2 , 即 

fx ( x ) = 

也即 ， X 为一正态随机变量，参数为= 0和 <7 2 .类似地，对于 fy ( y ) 可证明 


再利用第二个假设可知 C 7 2 = a 2 . 因此 X 和 y 为独立同分布的正态随机变纛，其 
参数为 M = 0 和 a 2 . ■ 

x 和 y 相互独立的一个充分且必要的条 件是： 联合密度函数（离散情形下为 
联合分布列> f { x , y ) 可以分解成两部分，其中一部分仅与: c 有关，另一部分仅与 y 
有$_ 

命题 2.1 连续型（离散型）随机变貴 X 和 7 相互独立，当且仅当其联合 
密度函数（联合分布列）可以写成 


fx,v(x,y) = h(x)g{y) 


— OO < X < oo, —CX) < 
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证明： 我们给出连续情形下的证明.首先注意到独立意味着 X 和 F 的联合 
密度函数等于其各自边缘密度函数的乘积，因此，当 X 和 Y 独立时，上述因式分 
解是成立的.现在，假定 fx . Y ( x , y ) 具有下列分解式 
fx , v ( x , y ) = h { x ) g ( y ) 

利用联合密度函数的性质可知 

1 = / [ fx,y(x,y)dxdy = j h(x)dx f g(y)dy = CiC 2 

J —oo J—oo J—oo •/—oo 

其中 Cl = /二 h ( a :) dar , C 2 = /二 g ( y ) dj / •这样 

fx ( x ) = J fx , y ( x , y)dy = CaM 1 ) fviy ) = J fx , Y ( x , y)dx = C \ g { y ) 
又由 CxCi = 1, 可以得到 

fx,Y(x ， v) = fx(x)fv{y) 


这样就完成了充分性的证明，命题得证. 口 

例 2 f 设 A ■和 y 的联合密度函数为 

{ 6e -2i e -3 1/ 0 < I < oo,0 <y <oo 
o 其他 

这两个随机变量是否独立？如果联合密度函数如下呢？ 

{ 24xy 0<x<l,0<y<l,0<x + y<l 
0 其他 

解： 第一种情况下，联合密度函数可分解因式，因此随机变童久和 y 相互独 
立（其中一个为速率 A = 2,另一个为速率 A = 3的指数分 布). 第二种情况下，因为 
联合密度函数非零的区域不能写成 x € A , yeB 的形式，联合密度函数不能进行 
因式分解，因此，随机变量 X 和 y 并不 独立. 通过如下方式更容易看出这一点，令 

{ 1 0 < I < 1，0 < j / < 1,0 < ar + y < 1 

0其他 


那么联合密度函数可写为 


f ( x , y ) = 2 AxyI ( x , y ) 


很显然，以上不能分解成分别仅与 x 和仅与 y 有关的两个因子. ■ 

当然，对于两个以上的随机变量，也可以给出独立性的 定义. 一般来说， n 个 
随机变量 XuX 2 , -, X n 称为独立的，如果以下条件 满足： 对于任何实数集合七， 
A ， …， An ， 有 
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A u X 2 eA ir - , X n € A n } = H P{Xi € Ai ) 

首先,可以证明上述条件等价于 

P{Xl 彡 <*1.-^2 《 <12, ... ， X n 《 0„} 

= flP { Xi ^ ai } 对所有的 Ol | fl 2. , tZ n 

i=l 

最后,对于无限个随机变量的独立性可以这样定 义的： 如果其中任意有限个随机变 
量都相互独立,那么称这无限个随机变量是相互独立的. 

例 2 g (计算机怎样选择随机子集) ① 大部分计算机都有内置程序,用以产生或 
模拟 （0, 1) 上的均勻随机变童的值（或称随机数).作为应用，计算机很容易模拟示 
性随机变量（伯努利随机变量) .设/ 是一个示性随机变量，即 
P{I = 1} = p = 1 — P{I = 0} 

计算机产生一随机数 t /((0, 1) 上的均匀随机数)，令 



就模拟得到示性随机变量现在我们希望从 {1,2, …， n } 中选择*个对象,使得 
(^)种不同的组合都有相同的机会被取上.我们用 ⑷, i 2 ，…， i „), 其中0 =喊 1(0 
表示数字:/没被选上,1则表示选上 )， j = 1,2, •. •， n , E "-! 0 = fc 表示 it 个对象的 
一种选择结果.令 表示 k 个对象的 一 个随机选择，且使得 
的种不同的个元素的组合都具有相同的机会被选中，即 (/!,•••,/„) 的分布 
列满足 

其中取值于 {0,1}, T ,?= iii = k . 利用条件概率公式 
P{(/!, 

= P{Il = tl } P {(/2, ••- >^ n ) = (*2. - - - .* n)|/l = * l } 

=P{h = *i}P{/a = *2\h = *i}-P{(/3. ••- ,In) = (*3. * • - ,in)\h =*i,/2 = ta} 
=P{h = h}P{h = * 2 |/i = ii}P{h — felA =*i. /a = *a} •• • 

■P{,n = *n|-^l = *1>' ■ ' i ,n-l = *n—l} 

①此例在讲解顒序上做了调整，作者先讲述亊件棋拟的方法，再在后面补充事件的概率的求法.译者 
先说明亊件的概率，然后讲述棋拟方法，此法较符合大家的思维习愤.——译者注 
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其中， / 1 = ij 表示，比如，当 ii = 1时,从集合 {1.2 - - , n } 中随机地抽 fc 个对象,1 
被抽中这一事件.因此， P{h = 1} = k / n y P{h =0} = ( n - k )/ n . 现在求条件分布 
P{h — *2 |A = * i }> W 

P {/ 2 = l|/i = 1} = P{h = 0 |/i = 1} = 

上式中第一个概率是 1 已经选中的情况下 ，2 被选中的 概率. 由于1已经选中，剩 
下还需选 A : - 1个对象在{2,…， n } 中2被选中的概率显然是 （fc - l)/(n - 1) •综 
合以上分析,对于 h , I 2 的分布，我们有如下 结论： 



对于一般的！，我们有 

P{Il+l = *i+l|^l =*!>••• >/| =*l} 




* 1+1 = 1 
t/+x = o 


有了上述的条件概率公式，我们就可以利用模拟的方法模拟上述 •••,/«• 首先 
产生 n 个相互独立的 (0,1) 上随机数 U U . "， U „. 定义 



U 2 <- 

i 

|0其他 


乃 +i 


1 Ui+i < 

0其他 


fc — (/l -I - Ii ) 


(i u n < k - {Il + ^ In -^- 

In={ Tl ~ 1 

lo 其他 

如此产生的其条件分布就是所要求的条件分布，且其联合分布满足 
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注释上述提供的方法并不需要很多的内存 .10.1 节将介绍一个更快的算法， 
但要求更多的内存 (10.1 节介绍的算法利用随机排列的后面 jfc 个元素). ■ 

例 2 h 令 x , y , 名服从 （0,1) 上均匀分布且相互独立，求 P { x > YZ ). 

解： 因为 

fx , Y , z ( x < y > z ) = fx ( x ) f Y ( y ) fz ( z ) = 1 0< i < l ,0< y ^ l ,0<2^ 1 

我们有 

P { X ^ YZ } = J J j fx,Y,z( x < z)dxdydz = J J J dardydz 

x^yz 

= l!l! {i ~ yz)dydz= J^ i ~ z 2) dz= l ■ 

例 2 i (半衰期的概率解释）令; V ⑴表示某矿物中放射性裂变物质在时刻 t 的 
含量.所谓半衰期是一个由经验确定的貴.放射性物质随时间的变化规律 如下： 
N ( t ) = 2-*作汉⑼ f >0 

注意到 N ( h ) = N (0)/2. 其中 / i 就称为半衰期.由 N ( t ) 的规律可知 
N{t + s ) = 2- ( j + t )/ fc 7 V (0) = 2~ t / h N ( s ) 

因此，不管已经消耗了多少时间，在未来的时间*内，这种物质的裂变规律都是按 
2-训 的因子减少. 

这个规律是通过对包含海量分子的放射性物质的观测得到，它看来与某种概率 
解释相吻合.由于裂变物质的比例不依赖于物质的总量，也不依赖于裂变时间区段 
的位置 （7 V(f + s )/ N [ s ) 与 和 均无关)，这样可以认为各裂变个体的寿命是 
相互独立的，并且是公共分布为无记忆的寿命分布.而唯一的无记忆的寿命分布为 
指数分布.由于裂变物质的半衰期为 ft , 我们建立下列概率模型. 

半衰期 h 的概率 解释： 各放射性裂变分子的寿命分布为相互独立的指数分布， 
分布的中位数为&记 L 为裂变分子的寿命，则 

P{L < t } = 1 - 2 - t/h 

由上式看出 P{L < h } = 1/2 ,同时上式又可写成 
P{L < i } = 1 — exp I — t 
这说明 L 的分布确是指数分布，并且中位数为 fc . 

现在假设在时刻0具有 N (0) 个分子,在时刻 t 具有； V ( t ) 个分子.实际上，每 
一个分子在时刻 t 时存活的概率为 p = 2-«/\这样 iV ⑴是一个二项随机变量，参 
数为 n = N (0 ),p = 2-.第8章将说明，当考虑含海量分子的放射性物质在一定 
时间框架下进行衰减时，半衰期实际上与一个确定的模型相联系.然而当考虑确定 
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数量的放射性元素时，确定模型的解释与概率模型解释的区别就很明显了 .® 

现在我们来讨论质子的蜕变问题.关于质子的蜕变问题是有所争论的.根据一 
种理论预测质子的半衰期为 10 30 年.为了对此理论进行检验，有人建议观察大 
量的质子,看它们在一两年内有没有蜕变.(显然不可能观察 10 30 年之后再看它们是 
否有一半蜕变, ） 现在假定观察 ^(0) = 10 30 个质子,观察期为 C 年.利用确定模 
型得到 ch 

N (0)~ N ( c ) = h(l - 2- c ，= 1 

« lim -——-——由于 士 = 10 -30 w 0 

x—o x h 

= Um ( c 2- Cx ln 2) 由洛必达法则 
= cln 2 0.6931 c 

例如，在 2 年中预计将会有 1.3863 个质子蜕变.但是如果在2年内没有观察 
到一个质子说变，那对于原来的假设(10 30 年中会有一半的质子脱变）是一个极大 
的打击. 

现在我们用概率模型来比较这一结论,我们观察个质子,共观察 C •年.由于 
h 相当大 (10 30 ), 每个质子在 C 年内蜕变的概率非常小.这样，在 C 年内蜕变的质 
子数具有泊松分布，其参数 n p = h -( l - 2-心）《 1/2 C . 这样 
P {0 个蜕变 } = e - c,n2 = e _ ln ( 2C > = 1/2 C 

一般情况下， 



这样，尽管在2年内蜕变的质子平均数为 1.3863( 由确定性模型得到)，但利用 
随机模型得到2年内没有观察到质子脱变的概率为 1/4. 这个结果不能推翻原来的 
关于质子的半衰期为 10 30 年的假设. ■ 

注释独立性是一个对称关系.久和 y 相互独立是指它们的联合密度（在离散 
情况下的联合分布列）是它们各自密度（概率）的乘积.因此 ，义 独立于 y 与 Y 独 
立于 a ■或者 y 相互独立是完全相同的意思.我们在考虑 X 是否独立于 y 的 
时候，必须考察 y 的值的改变，是否会改变 x 的条件 分布. 有时候，我们不能很直 
观地作出判断.但是若把 a ■和 y 的地位对调过来，考虑 y 是否独立于此时问 
题变得十分明显.下面的例子就说明了这一道理- 

例 2 j 名为 “ Craps ” 的掷骰子游戏规定每次抛掷两颗骰子，若第一次两颗骰 
子的点数之和为4,此时玩家必须继续抛掷这两颗殺子，直到出现点数之和为 4 或 

①在第8章中，我们将介绍大数律.大败律正好说明^ ~p = 2-" 2 . 由于况 (0) 和 W ( t ) 都是 
很大，可以认为 N(t) = ⑼.——译者注 
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7 为止. 如果最后掷出的点数和为4,那么玩家贏，如果为7,则玩家输.为了更好地 
了解游戏中某些童之间的关系，我们将这个游戏简化为下列掷敗子试验.每次掷两 
颗骰子，直到出现两颗骰子的点数之和为4或7为止.令 iV 表示试验停止的时候， 
所投掷的次数.令 X 表示最后一次投掷的点数之和（或者4或者 7) .那么 AT 是否 
与 X 独立？也即，知道了 X 的值,会不会影响 iV 的分布？很多人并不能从直觉找 
到这个问题的答案.然而，如果我们换个角度问 X 是否独立于 AT , 也即，知道了头 
一次出现点数之和为4或7时的抛掷次数，会不会影响到该点数之和究竞是4 ( 或 
是 7) 的概率？举例来说，假设我们已经掷了 n - 1次般子,各次均未出现点数之和 
为4或7,但第 n 次出现了 4或 7. 现在问 n 的值会不会影响到 尤 = 4或 X = 7 
的概率.当然不会，因为所关心的为4或7,而前 n - 1次抛掷既没出现4也没出 
现7这一事实不会改变第 n 次抛掷的概率.因此，我们可得出 A " 独立于况，或者 
等价地, 7 V 独立于 A ： 的结论. 

另一个例子，令 X U X 2 , … 为一系列独立同分布随机变量,假设我们按顺序观 
测这些随机变量，如果>不，对任意 i = 1,.. • ,n - 1成立，那么我们称为 
记录值 (record value ). 也即，在序列中任何一个值，若它比其前面的值都大则称这 
个值为一个记录值.令表示亊件 “ X „ 为一记录值”，那么4„ +1 是否独立于 
A n ? 也即，知道了第 n 个随机变量为前 n 个随机变量的最大值是否会改变第 n + 1 
个随机变童为前 n + 1 个随机变量最大值的概率？尽管4„ +1 与独立，但是却 
不是凭直观显而易见的.然而，如果我们换个方式，问是否独立于那么 
结论是非常容易理解的.因为知道了第 n + 1个随机变童比 X u …、 X n 都大，这个 
事实显然没有提供任何关于在前 n 个随机变量之间的顺序的信息.事实上，利 
用对称性可得，这 n 个随机变量里，任何一个为最大值的可能性都是一样的，因此 
P (^ n | i 4 n + i ) = P ( A n ) = 1/ n . 总而言之，和 A n + l 是相互独立事件. ■ 

注释从下面的等式 

^{■^1 ^ Ol , ••- , X n ^ On } 

= P { X \ ^ ai } P { X2 ^ 021-^1 ^ ° i } • • • Pd 彡 ^ Qi » • ■ • iX n -i ^ a n - i } 
可知，要证明 x u - -, x n 的相互独立性，可以通过序贯的方式加以 证明. 也即，我 
们要证明这些随机变量是独立的，只需证明以下的一系列事实 
X 2 独立于 A 
X 3 独立于 X U X 2 
X4 独立于 Xi , X 2, X 3 


X n 独立于 Xi ，… , X n _i 
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6.3 独立随机变量的和 


当随机变量 X 和 F 独立时，从它们的联合分布求出 X + Y 的分布常常是很 
重要的.假设；(:和 Y 是相互独立的连续型随机变量，其密度函数分别为 / x 和 / y , 
那么 x + y 的分布函数可以如下 得到： 

= P{X + Y < a } = JJ fx{x)fY(y)dxdy 


=r r v f X { x ) f Y ( y ) dxdy = r「 v f X ( x ) dxM y ) d y 

J —oo J —oo J —oo J—oo 

=r F x ( a - y ) f Y ( y)dy (3.1) 


分布函数 F x+y 称为分布函数和化（分别表示 A ■ 和的分布函数） 的卷积 
(convolution). 通过对 （ 3.1) 式求导，我们可得 X + K 的密度函数 f x+Y 如下： 
fx+Y ⑷ = 石 / F x (a- y)fy(y) dy = y — Fx(a-y)/y(y)dj/ 

=J fx ( a - y ) fY ( V)dy (3.2) 


6.3.1 均匀分布的随机变量 ® 

对于两个相互独立的， (0,1) 上均匀分布的随机变量，其和的分布是不难求的. 
例 3 a (两个独立均匀分布随机变量的和）设 A •和 y 为独立随机变量，都服 
从 （0,1) 上均匀 分布. 求 x + y 的概率密度. 

解： 因为 

fx(p) = M<») 

利用 (3.2), 我们可以得到 

fx+Y(o) = j。fx(a-y) dy 

先设 0 < a =$ 1, 于是 ® 

/ x+y ⑷ 

当 1 < a < 2 时，类似地可得 

/x+y ⑷-/ dy = 2 -a 



{ 1 0 < a < 1 

0其他 


① 本节作者只讨论了 （0,1) 上的均匀分布的随机变*,但不难推广到一般情况.——译者注 

② 这是因为当 W > a 时， fx(a - 1») = 0;当0 < y < a 时， /x(a - V) = 1. -译者注 
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{ a 0<a< 1 

2 - a 1 < a < 2 

0 其他 

X + r 的密度函数的形状见图 6.3, 其 
密度函数像一个搁在 a ： 轴上的三角形， 
因此 X + y 的分布又称为三 角分布 
( triangular ). ■ 

现在假定 X u X it …， X n 为独立同分布的 （0,1) 均匀随机变量序列.记 
F n ( x ) = P { X l + --+ X n ^ x } 

F n ( x ) 的分析表达式十分复杂，然而，当 a : < 1时, F n ( x ) 具有很好的表达式.现在 
我们用归纳法证明 

F n ( x ) = x n / n \, 0 < x ^ 1 

由于上式当 n = 1时成立.现假定对 n - 1上式也成立，即 
F n . i ( x ) = i n ~ l /(n - 1)!, 0彡 I 彡 1 



图 6.3 三 角分布 


现在将:不写成 n n _ x 

利用 （3.1) 式可得 

Fn (*) = / Fn - i(x - y ) f Xn ( y)dy 
Jo 

= j\x - y ) n ~ l dy 由归纳假设① 
x n 

=否， 1 

利用 F n ( x ) 的这个表 & 式可以得到一个十分有趣的结果.设 X U X 2 , …为一 
列独立同分布的 (0,1) 上的均匀随机变量.我们需要求出下列随机变量#的期望 

五[外 

N = min{n : Xi + • • • + X n > 1} 

注意到 N > n 的充要条件为 A + • • • +《1,这样 

P{N > n } = P{Xi +-+ X „<1} = i ^ l ) = 1/ n !, n > 0 
由于 P{N > 0} = 1 = 1/0!, 我们得到 


①即 J。 1 F n . x {x-y)J Xn (y)dy = / 0 1 F n (x-y)d» =/ 0 * F„-i(x-y)dy = f^x-y) n - l dy. 
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P{N = n } = P{N > n - 1} - P{N > n }= 


这样 


(n — 1)! n ! — n ! 


= E 


n(n — 1) 


00 1 


( n -2)! - 


这样，总和超过 1 的均匀随机数的（独立同分布的 (0,1) 均勻随机变量）最小个数 
的平均值为 e . 


6.3.2 r 随机变置 


回顾 r 随机变量具有如下形式的密度 函数: 


f(y) 


入 e _* v ( Ay)*-i 

^ f ( tj ~ 


0 < y < oo 


这种分布的一个重要性质就是，对于给定的 A , 它在卷积意义下是封闭的. 


命题 3.1 如果 A ■和 K 为独立 r 随机变童，参数分别为 （《， A ) 和 ⑷ A ) 那 
么 x + y 也为 r 随机变 ft , 参数为 （s + 1，； o . 

证明： 利用公式 (3.2), 可得 


/x + y(a) = (。- 叫 A(a - 知 ( 知广 1 dy 

= Ke~ Xa /"(a-yr-y-^y 
Jo 

=ife- Ao o ,+t - 1 f (1- x)- 1 ! 1 - 1 di 令 x = K 

Jo a 

=Ce _Ao a* +t_l 


其中 C 为一个不依赖于 a 的常数，但因为上式为一概率密度函数，因此积分值等 
于1,这样就确定了 C 1 的取值.我们得到 

Ae ~ Aa ( Ao ) a - 1 


fx+v(a ) = 


r (* + «) 


命题得证. 口 

利用命题 3.1 及归纳法,很简单地可以 得到： 如果 = 为独立 r 随 

机变量，其参数分别为 ㈨ ， A),i = 1,…， n , 那么 Er = i ^ i 为参数的 r 
随机变童，我们将其证明留作习题. 

例 3 b 令 X U X 2 , … ， X n %n 个独立指数随机变量，其公共参数为 A . 由于 
参数为 A 的指数随机变童同时也是参数为 （1, A ) 的 r 随机变量,这样通过命题 3.1, 
可得 Xi + X 2 + --- + X n 为一参数为 （ n , A ) 的 r 随机 变量. ■ 

如果 A , z 2 , - - , z n 为相互独立的标准正态随机变量，那么 y = E?=1 zf 称为 
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服从自由度为71的 X 2 分布的随机变量.我们来计算其密度函数.当 n = l,y = Z 2 , 
利用第5章例 7 b 可看出，其密度函数 如下： 


純 ) = 2 ^ [/z( ^ + /z(_ ^ 1= 2 ^^ 


ie-v/2(y/2)V2-i 


由上述形式可以看出， f Z 2( y ) 为参数 （1/2,1/2) 的 r 分布.[从以上分析可以顺便得 
到 结果： r ( l /2) = y / n \. 但由于每个纪都服从 r ( l /2, l /2), 利用命题 3.1 我们可 
得：自 由度为 ri 的 x 2 分布就是参数为 （ n /2,1/2) 的 r 分布.因此，其密度函 数为： 


fx<y) 




y > 0 


当 n 为偶数时， r(n/2) = [(n/2) - lj!, 而 n 为奇数时， T ( n /2 ) 可以反复利用关系式 
r(t) = (t-l)r(t-i) 进行计算,再利用之前得到的结果 r(i/2) = ^可以得到 
r(n/2) 的值.[举例来说， r(5/2) = ^r(l) = ^r(i) = |^i.] 

x 2 分布在实践中经常作为以下问题中的误差的平方和的分布 出现： 如果某人 
试图击中 n 维空间里的目标，其中每个方向上的误差为独立标准正态随机变量，则 
各个方向上的误差的平方和的分布为自由度 n 的 X 2 分布. 它在统计分析中也是 


很重要的. 


6.3.3 正态随机变置 

我们还可以利用公式 （3.2) 证明关于正态随机变量的以下的重要结论. 


命題 3.2 若= 1 ,...，n 为独立随机变量，它们均服从正态分布，各 
自参数分别为= 1,…， n , 则也服从正态分布，参数为 

证明： 首先，令 X 和 y 为独立正态随机变量， X 的均值为0,方差为 ( T 2 , 而 y 
的均值为0, 方差为 1. 我们要利用公式 （3.2) 来计算 X + y 的密度函数.设 
1 1 1 + a 2 

c 

这样’有 

/x(a-y)My) = ^exp{-^^}^=exp{-^} 

= 2^ eXP {~^} eXP {- c(!/2_ 2!/ } 


因此，由公式 (3.2)， 有 
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fxMa) = i exp { — ^ } 哪 {^(TT^)} x / 二哪 {— 七 — TT^Y} dy 

= 忐 exp { - %^ } /二 exp { - 0x2 } 如 = C ex P {-} 

其中 C 的取值不依赖于 a . 上式意味着 X + Y 服从均值为0,方差为1 +( T 2 的正 
态分布 • 

现在，假设和 X 2 为独立正态分布随机变量， A 的均值为 M < ， 方差为<， 
i = l ,2. 那么， 

Xl+ X 2 = a 2 (^l + ^^) +/i i+W 

但因为 ( Xx - m )/^ 服从均值为0,方差为 al / al 的正态分布，而 ( X 2 -離 2 服从 
均值为0,方差为1的正态分布，利用前面的结果可得 （ Xi - /1)/<^ + (义 2 -/1)/内服 
从均值为0,方差为 l + «7?/ t ^ 的正态分布,这意味着 Xi + X 2 服从均值为 M 1+ M 2, 
方差为 £7^(1 + ( Tx / Oi ) = <Ti +<72 的正态分布. 

因此，当 n = 2时，命题 3.2 成立.一般情形可通过如下归纳法得到，也即，假 
定对于 n - 1个随机变量时成立,现在考虑 n 的情形， 

^2 Xi = J 2 Xi + X n 
i=l »=1 

利用归纳假设,服从均值为方差为 Z 7= i 1 ^ 的正态 分布. 因此， 
利用 n = 2的结果，可得 E ?=1 Xi 服从正态分布，参数为 EIU W 和 Er =1 ^ ? - □ 

例 3 c 某俱乐部篮球队一个赛季打44场 比赛. 其中有26场是对甲级队，18 
场对乙级队.假设对甲级队每场胜的概率为0.4,而对乙级队每场胜的概率为 0.7. 
假设每场比赛结果都是独立的.近似计算以下事件 概率： 

( a ) 该队能贏 25 场以上 比赛； 

( b ) 该队胜甲级队的场数超过胜乙级队的场数. 

解： （ a ) 令 X A 和分别表示该队同甲级队和乙级队比赛获胜场数，注意到 
Xa 和 X B 为独立二项随机变量，及 

E [ X a ] = 26 x 0.4 = 10.4 Var(D = 26 x 0.4 x 0.6 = 6.24 
E [ X b ] = 18 x 0.7 = 12.6 Var ( X B ) = 18 x 0.7 x 0.3 = 3.78 
利用二项分布的正态近似可得， Xa 和 Xb 都近似服从均值和方差如上的独立正态 
分布.因此，由命题 3.2, 心+ 近似服从均值为 2 3,方差为 10.02 的正态分布. 

令 Z 表示标准正态随机变量，我们有 
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p { x, + x„>^ } = P { x^x B> ^ } = P{^ 為 - 23 » 習 } 

w P | z ^ -^==} a 1 - P { Z < 0.4739} « 0.3178 


( b ) 注意到近似服从均值为 -2.2, 方差为 10.02 的正态分布.因此 

= P 产為 22 > °-^j 

« p { z ^ -；；==} W 1 - P { Z < 0.8530} « 0.1968 

因此，该队近似以 31.87% 的概率贏得 25 场比赛，与甲级队比赛获胜场数超过与乙 
级队获胜场数的概率近似为 19.68%. ■ 


如果 in ( y ) 为正态随机变量，均值为 / x , 方差为 a 2 , 那么 y 称为参数为 （ M , 为 
的对 数正态 ( lognormal ) 随机变量. 也即，如果 K 能够 表示为 K = e '其中 X 为 
一正态随机变量，那么 y 为对数正态随机变量. 

例 3 d 令 5( n ) 表示从某时刻开始， n ( n ^ 1) 周后某证券的价格.一个比较 
流行的关于证券价格运行的模型认为股价比例 5( n )/5( n - l ), n > 1为独立同分 
布对数正态随机变量，假设该模型的参数为 ， M = 0.0165, «7 = 0.0730, 试求以下事件 
概率： 

( a ) 接下来的两周证券价格都在 上涨； 

( b ) 两周后的证券价格比现在的髙. 

解：令 Z 为一标准正态随机变量.为了解答 （ a ), 我们利用以下亊实， ln (: r ) 对 
于 x 递增蕴含着 “ a : > 1当且仅当 ln ( x ) > ln ( l ) = 0". 这样,我们有 


p {f® >1 } = p ( ln (l? 55 ) >0 } 

= p{z> = P{Z < 0-2260} = 0.5894 

因此,一周后价格上涨的概率为 0.5894. 由于连续的价格比独立，因此,接下来的两 
周价格都上涨的概率为 0.5894 2 = 0.3474. 

(b) 的解答 如下： 

哨|>1}—{纖!+个(謡 W 調 M 

由于 In (5(2)/5(1)) IP In (s(l)/S(0)) 为独立同分布的正态随机变量，公共参数为 
= 0.0165, < t 2 = 0 0730 2 , ^们和的期望为 2叫= 0.0330, 方差为 2 x 0.0730 2 , 因此 

叫謅 > 4 =巾 > m }= p(z< °- 31965 >= 06254 ■ 
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与其试图推导出离散型情形下的 x + y 的分布函数的一般表达式，不如来看 
看以下几个例子： 

例 3 e (独立泊松分布随机变量的和）设 X 和 y 为独立泊松分布随机变量，参 
数分别为 Ai 和 a 2 ，求 X + y 的分布. 

解： 因为事件 {X + y = n } 能够写成互不相容事件 {X = k,Y = n - k },0^ 
k ^ n 的并，因此有 

P{X + y = n} = ^P{X = k,V = n-k} = ^P{X = k)P{Y = n - fc} 
fc =0 fc =0 

= y' --A! ^1. -A a A 3~ fc = e -(A!+Aa) y' A l A 2~ fc 

= ~ — Sfc!(n-)fcj! AlAr = —— (Al + A2r 

也就是说 , Xx + X 2 服从参数为 Ai + A 2 的泊松分布. _ 

例 3 f (独立二项分布随机变置的和）令 A •和 y 为独立的二项分布随机变量， 
参数分别为 ( n ， p ) 和 ( m , p ), 求 X + V 的分布. 

解： 回顾二项分布的知识，根本不用任何计算，我们也可以马上推导出 ， x + y 
服从参数为 (n + m , p ) 的二项分布.这是因为 X 表示了 n 次独立重复试验中成功 
的次数（每次成功的概率为 P ), 同样， y 表示了 m 次独立重复试验中成功的次数 
(每次成功的概率也为 P ), 由于假定 X 和 y 独立，所以 X + Y 表示了在 n + m 次独 
立重复试验中成功的次数（每次成功的概率为 p ). 这样，； f + y 为参数为 (n + m , p ) 
的二项随机变量.下面从分析的角度验证该结论，注意到 

P{X + y = fc } = ^ P{X = i,y = fc - i } 

<=o 

=x ； p{x= i}P{Y= k -i}=fi 0 " _< (广 - k+i 

t=0 t=0 

其中 q = l - p 且当 _?• > » •时 = 0. 因此 

P{X + Y = k }= PV 一 E ( H ) 

i=0 

最后利用以下组合恒等式便可得到所需 结果： 

m 初 ㈡ ■ 

»=0 
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6.3.5 几何随机变量 

设 A ，…， 是独立的几何随机变量序列， X * 的分布参数为 Pi , i = 1,2, • • • , n . 
现在我们要求出和的分布列.作为应用，考虑 n 个硬币，假定第 i 个 
硬币在抛掷时正面向上的概率为 Pi,t = l , ••- , n . 假定将第1枚硬币进行抛掷，直 
到出现正面向上为止，同样，将第2枚硬币也抛掷到出现正面朝上为止，等等.令 
Xi 为第 i 枚硬币的抛掷次数，则 X u …， X n 是独立的几何随机变量序列，其分布 
参数分别为 Pl,P2, -,Pn, 此时就是抛掷硬币的总 次数. 若所有 ft == P, 此时 
5„就是连续抛掷硬币，直到出现第 n 次正面向上时的抛掷总次数 . S „ 具有负二项 
分布,其分布列为 


i >{ S „ = fc } = O n ( l - p ) fc _ n ， 

上述公式只是我们所解决问题的一个前凑.现在解决所有 P < 不同的 情况. 先解决 
n = 2的情况,记％ = 1 — Pj,j = 1,2,我们有 


P{Si = fc ) = 5^ P{Xi = j , X 2 = k - j } 
i=i 
k-l 

=^{-^1 = = k — j ) (由于尤1，义2相互独立） 

j=l 

= 5^Pi9i - 1 P292~ ，_1 =PiP29$ _2 卜 1 =PiP292 -2 1 

j=i i=i v /v 

= 刪 2 卜 1 - ElMti = +Pig f-> _5l_ 

92 - Ql 92 - 9 l Pi — P 2 P 2 - Pi 


现在令 n = 3, 并计算 P { S 3 = k ), 将已得到的关于 P { S 2 = j ) 的公式代入 P { S 3 
k ) 的下面的表达式 


P{S 3 = k} = J2 P{S 2 = J,X 3 = fc-j} = 5Z P ( S2 = J'} p t X 3 = k-j) 


经过一些运算，最后得到 

P { S 3 = *} = Pi 9 i _ 


^ P 393 _1 


P 2 • P 3 
2 — Pi P 3 —P 
Pi P 2 
Pi - P 3 P 2 - P 3 


^ P 292 _ 


这个公式很有规则，由上式以及 P { S 2 = *：} 的公式，可以猜测到尸 { S „ = fc } 的一 
般公式.下面是关于 P { S n = k } 的一个命题. 
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命题 3.3 设 . • • , 为一独立的几何随机变量序列， X * 的分布参数为 

p <, 假定 p < 都不相同，则对于 k ^ n , 

p( 5 n =k}= fx 1 n 

_ <=1 j ^ i vl Vx _ 

证明： 我们用对 n + fe 作归纳法证明此命題.对于 n = 2, *: = 2,命题是正确的 • 
现在假定，对一切左彡〜^ + ^彡^命题成立.现在令 fc > n , 并且 n + fc = r + l •利 
用全概公式 

P { S n = *} = P {5„ = fc | X „ = l } P { X n = 1} + P {5„ = fc | X „> 1} P { X „ > 1} 

= P { S n = k \ x n = l } p „ + P { S n = k \ X n > l } q n 


对于条件 = 1}, 我们有 

P{Sn = k\X n = 1} = P{Sn-l =k-l\X n = 1} 

= P {5„_1 = A ： — 1} (由 Xn 与 Sn -1 相互独立) 

=Y,Piii~ 2 n ( 由归纳法假设） 

*=1 的 《 n-l 卩 广 卩* 


现在设 A " 是一个参数为 p 的几何随机变量，经过计算可知， 在 X >1 的条件下 X 
的分布与1 + y 的分布相同，其中 y 的分布与 X 的分布是相同的.同样，在 
X „ > 1下条件分布与 X ! + ■■■ + Xn-l +Y + 1 的分布相同，其中 Y 与的分布 
相同，并且 y 与 x 1 ,--, x n - l 是相互独 立的. 这样，我们得到 

P { S n = k \ X n > 1} = P{Xi + ••• + X n -i + X n + l = k ] 

= P{s n = A: - 1} 


=E«rf- ! n ^ ( 由归纳法假设） 

i=l i ^ j<n V] y, 

在得到 P{S n = k\X n = 1} 与 P{Sn = k\X n > 1} 的表达式以后，由全概公式可得 

p{s n = k) =p n ^2 piQi~ 2 n p p ip. +qn iz piq i~ 2 n 

<=1 的 <n-l Pj P * t=l y, 

= Pn ^>9 t fc_2 FI II 

i=l Pl Pt i=l «/j«n ^ yi 


一 


= 5 Z P ‘9? _2 P n (i 


II r ^ ir + P ^ n - 1 !!^ 
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现在利用恒等式 
前式变成 


gn _ Pn~ Pi+g n _ qi 
n-Pi Pn-Pi Pn ~Pi 


p{s n = k }=j： PiQ r n 


= zk 1 n - 


由归纳法知，命题得证. 


6.4 离散情形下的条件分布 

回顾对于任两个事件 E 和已知 F 的条件下£的条件概率（假定 P ( F ) > 0) 
定义 如下： 

PW) = 

因此，如果 A •和 K 都是离散型随机变量，那么很自然地定义已知 Y = y 的条件下 
x 的分布列 如下： 对于所有满足 Mv ) > 0的 j/， 有 

p x ^ W )- p { x - x \ y P{X =^ X ' Y ： V) = ㈣ 
p { y =i/} py ( v ) 

类似地，也可以定义已知 Y = y 的条件下X的条件分布函数，对于所有满足 
Py ( v ) > 0 的 y, 有 

Fx \ r ( x \ y ) = P{X < x\Y = i/} = ^ 2 px \ Y ( a \ y ) 

由上述定义可知，条件分布与普通分布在概念上是完全一样的，只是所涉及的事件 
都是在 Y = y 之条件意义下的事件.如果 A •和 y 独立，那么条件分布列和条件分 
布函数同通常分布列和分布函数是一 样的. 这是因为，如果X和 y 独立,那么 
Px \ v ( x \ y ) = P{X = x\Y = y ] 

_ P{X = x,Y = y ) P{X = x } P{Y = y } 

= ~ P{Y = y }~ = 


P{Y = y) 

例 4 a 假设 X 和 y 的联合分布列 p{x,y) 如下： 

p(0,0) = 0.4 p(0,1) = 0.2 p(l,0) = 0.1 p(l,l) = 0.3 
求已知 y = 1 的条件下 A ： 的条件分布列. 

解： 首先注意到 

即 ⑴= = P(°' 1)+P(1 ， 1) = 0.5 


P{X = x} 



因此， 
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Px|y(0|l) 


P(0 ， 1) 
Pv ⑴ 


2 

5 


及 


Px|y(l|l) 


P(l ， l) 3 
py ( l ) ~ 5 


例 4 b 如果 X 和 y 为独立泊松随机变置，参数分别为 Ai 和 A 2 , 求给定 
X + Y = n 的条件下 X 的条件分布. 

解 ：给定 X + K = n 条件下 X 的条件分布列计算如下： 


P{X = k\X + Y = n ) 

P{X = k,Y = n - k ] 
: ~ p{x + y = n }~ 


P{X = k,X + Y = n } 
~ P{X + Y = n } 

P{X = ib } P{y = n - k } 
P{X + y = n } 


其中最后一个等式的成立是由于假定了 X 和 y 是独立的.注意到（例 3 e)X + Y 
服从参数为 h + A 2 的泊松分布，这样 

e ~ Al A { e ~ A ; l Ag~ fc [ e- (Al+Aa) (Ai + A 2 )" ~| 一 1 
" k \ (n - fc )! n ! j 

^ 2~ k = ( n \ ( A , \ 

'( n - k)\kl (Ai + A 2 ) n ~ \kJ \Xi + X 2 J 


P{X = k\X + Y = n }= 


xrhd 


也就是说，给定 ； f + y = n 的条件下的 X 的条件分布为二项分布，参数为 （ n , 
Aj/(Ai + Aa)). ■ 

我们还可以讨论联合条件分布，正如下面的两个例子所阐述的 • 

例 4 c 考虑如下的多项 分布： 


I * 

P { X i = n <) t = !,••• , fc } = ni , n ； Wfc { Pi 1 n *>0 ,gm = n 


这样的分布列出现在下面的 情形： 进行 n 次独立重复试验，每次试验的第 i 个结 
果发生的概率为 Pi，EtiPi = 1 - 随机变量 X„i = l , -, k 分别表示 n 次试验中 
试验结果 = 出现的 次数. 现在假设我们已经知道在 n 次试验中，第 j 

个试验结果出现了巧次, j = T" + l， …， fc, 其中 Ej=r+i^ = m < n - 由于另外的 
n - m 个试验中每一个结果都必然是第1,…， r 个结果之 一 ，因此， A ，…，&的 
条件分布应该是多项分布，其相应的参数为 

P{ 第 i 个结果 | 试验结果不是 r + 1，…， fc 中任一结果 } = |r i = lr - ,r 

其中凡=1：[ =1 巧为试验结果为1,…， r 之一的概率. 

解： 为了验证该直观结论，令 m， …，〜满足 E[=i m = n - m, 那么 
P{X\ =«!,-•• ,X T = UrU+l = « r+li … >^k = ^ fc } 

P{X\ =»!,-•• ,Xk — »fc} _ ni ! Pi * Pr r Pr+l … Pfc* 

P{X r+ i = Tir+i, •" ,Xk = n fc } ( n _ m )!,^4, t... n »! ^* _m Pr+V "'Pfe* 
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上式分母中的概率计算如下，将试验结果1,2,…， r 合成一个结果，其相应的概率 
为巧，相应出现的次数为 n - m . 这样，事件 { X r+1 = nr +1 , •• - , X k = n k } 的概率 
可以看作是 n 次试验中，具有 fc_r + l 个结果的多项分布中事件的概率.将上式 
中分子分母相互抵消，可得 


• P{Xi =«!,••• , X r = nr | X r+ i = nr + 1 , ••- ,Xk = n *} 

_ (w -ro)! /Pi (EL\ nr 

— m ! ••• n r ! Vf ；/ 

这样结论得证. ■ 

例 4 d 考虑 n 次独立重复试验，每次成功概率为 p , 已知共有次成功的条 
件下，证明所有可能的*次成功、 n - k 次失败的顺序都是等可能的. 

解： 我们将要证明，种可能顺序中任一种都是等可能的.令 X 表示成功 
的次数，考虑 fc 次成功、次失败的任一排列，比如 ,o = ( s ,,/), 那么 


P ( o\X = k ) = 


P ( o,X = k ) = P ( o ) 
P(X = k ) = P(X = k )'' 


P *( l - P ) n - 


( 1 )^( 1 - P) n ~ k © 
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如果 X 和 y 具有联合密度函数 f ( x , y ), 那么给定条件 y = y 下，的条件密 
度函数定义如下，对于任意满足 f Y ( y ) > 0的 j / 值，有 

/寧(咖)=错 

为了说明条件密度的实际含义，在上式左边乘以 da :, 右边乘以 { dxdy )/ dy , 这样可 
得 


fx\y(x\y)<ix = 


f ( x , y)dxdy 〜 P{x ^ X ^x + dx,y + dy } 

fr ( y)dy 〜 P{y < K < y + dy } 


P{x < X < x + dx|y < y < 1 / + dy } 


也就是说，对于很小的 di 和 dy , fx \ Y ( x \ y)dx 表示了在 F 取值于 j / 和 j / + dy 之 
间的条件下，久取值于 a : 和 z + da : 之间的条件概率. 

利用条件密度，还可以定义已知一个随机变童的取值条件下，关于另外一个随 
机变董的事件的条件概率.也即，如果 A •和 F 联合连续，那么对任一集合总有 
P{X €A\Y = y} = J ^ fx\v(x\y)dx 

特别地，令力= (-00,0], 那么已知 y = y 的条件下 X 的条件分布函数 如下： 
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^X|y(a|l/) = P{X < o I y = y} = J f x \y(x\y) ^ 

读者应该注意到，上述讨论已经给出了条件概率的较完整的定义，即使条件 Y = y 
是一个零概率事件，相应的条件概率也有较明确的含义. 

例 5 a 尤和>"的联合密度 如下： 


,,、 (^ x (2 -x-y) 0<x<l,0<y<l 

f^y)=\ 5 廿仙 

|_0 其他 

求己知 Y = y 的条件下, A ： 的条件密度,其中0 < y < 1. 

解： 对于 0< a :< l ，0< y < l ， 有 

,,_、 f(x,y) f(x,y) 

/W (咖-丽 

x{2 — x — y) _ x (2 — x — y) _ 6 j (2 — x- y) 
/o x(2-x- y) di § - y / 2 4 - 3 y 


例 5 b 假设 a ■和 y 的联合密度 如下: 

f e -x/y e -y 

/(*»!/) = I y 


0 < ® < oo ,0 <y <oo 

其他 


求 P{X > 1\Y = y). 

解： 我们先求得 y = y 条件下 X 的条件 密度： 

, … f(x,y) e -*/« e-Vy 

知 = 7^ = e-»r ( i/„) e -^ - 

因此， 

P{X > 1\Y = y}= r ie-*/»dx = - e -*/ v |~ = e _"v 
Ji V 


如果 X 和 y 为独立连续型随机变量,那么给定 Y = y 的条件下， X 的条件密 
度同非条件密度是一样的，这是因为在独立情形下， 

/x|y(x|y) = W = fX Mv)~ =fx{x) 

当随机变量既非联合连续，也非联合离散，我们也可考虑相应的条件分布.举例来 
说，假设 X 为一连续型随机变量，其密度函数为 /，而 N 为一离散型随机变量，那 
么考虑给定 N = n 的条件下 A " 的条件分布，有 

P{x < X <x + dj|iV = n } 
dx 
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_ P{N = n\x < X < z + dr} P{x < X < x + da:} 

P{N = n} dx 

令 dx 趋于 0 , 可得 

.. P{x < X <x + dx|7V = n} P{N = n\X = x} x 
d*-o di = ~■ P{N = n} ~ ，⑷ 

这样就证明了给定 N = n 的条件下, X 的条件密度为 
P{N = n\X = x} , 

* P{N = n}~ 

例 5 c (二元正态分布）二元正态分布是非常重要的联合分布之 一. 如果对常 
数 > 0,< T V > 0,-1 < /» < 1,以及所有的 -oo < < oo , 随机变量 A ■和 

V 的联合密度为如下 形式： 


/ x | Af (* l «) = 


L f(x) 


f(x,y)-- 


2na x a y \/\ — p! 2 


p {• 20^7) [(^r) 2 




(i - fi x ){y - 




那么称它们为二元正态分布.现在我们来计算给定 Y = y 的条件下 X 的条件密 
度.为了做到这点，我们先把与: r 无关的因子都收集一起，并将它们表示为 G ，最 
后这个常数可利用/二 / x | y ( x | y)dx = 1得到 • 


fx\v(x\y ) == Cif(x,y) 

= — {_♦[(〒)、，_]} 

= C36XP {- I〆 - 21 ㈧ + p ^ y ~^}} 

=C4exp {- 卜卜 +…))] 2 } 

注意到上述函数为正态分布的密度函数，因此可以推得，给定 K = j /的条件下，随 
机变量 x 服从正态分布，期望为〜方差为 4(1 - p 2 ). 而且，由于 
Y,X 的联合密度同 X,Y 的联合密度的¥式是一样的，只需将七,〜与的 
地位相互对换即可.由此可知， 在 x = x 给定之下， y 的条件分布为正态分布，期 
望为叫 + p ££( x _ Ml ), 方差为 4(1 - P 2 ). 从这些结果可以看出，对于联合正态的 
随机变童 X , P 来说，它们相互独立的充要条件是 X,Y 的相关系数 P = 0. (这个结 
果也可从它们的联合密度直接看出，因为只有当 p = 0时，它们的联合密度才能分 
解成两个因子，其中一个因子只与 a ： 有关，另一个因子只与 y 有关 .） 

X 的边缘密度可以通过如下计算 得到： 
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fx ( x ) = I f ( x ， y)dy 

- c £ 二卜心 [(〒)' 切 - 2，^^] h 

其中 C = ^-——^===, 作变置替换 w = ( y - My )/% 得 

fx(x) = C °y^ {- 2 ( 137 )(^) 2 } 

X l. 00 exp {- ^r^y^ 2 - 2p ^r w )} dw 

為 exp {_ (Sr) 2(1 ~ p2) } 

x Il exp {- w^){ w ~ p ^ry} dw 

由 

/ 二啡 卜 2(^7) =i 


可以得到 

fx { x ) = C <7 v y /2 n(l - p 2) e -(*-/*.) a /2< r 2 = l _ e -(*- M .) a / 2 ^ 

V2n<7* 

也即， X 服从正态分布， 均值为 fx t , 方差为类似地， y 也服从正态分布，均值 
为 Mv , 方差为 ■ 
例 5 d 考虑 n + m 次重复试验，每次成功的概率相同.然而，假设此概率并不 
是固定的，而是一个随机变量，其分布为 (0,1) 上的均匀分布.试问已知 n + m 次 
试验有 n 次成功的条件下每次成功的概率的条件分布？ 

解：如果令 A " 表示试验成功概率,那么 A ■为（0, 1) 上均匀随机变童.同样，给 
定 ； f = a : 条件下 ， n + m 次试验是独立重复试验，其成功的概率为 a :, 而且成功的 
次数 W 为参数为 (n + m , x ) 的二项随机变量.因此 ,给定 N = n 的条件下 X 的条 
件密度如下 


= CE n (l — X) m 

其中 c 不依赖于； r . 因此，其分布密度是0分布，参数为 （n + 1 ， m + 1). 

上述结果很有意义，它阐述了若重复试验的每次成功的概率（先验概率）为 
(0,1) 上均勻分布[或者，也就是参数为（1，1)的/?分布]，则经过 n + m 次试验后， 
总共有 n 次试验成功的条件下，其后验分布（或条件分布）是参数为 (l + n,l + m ) 


f»{AT = n \X = x } fx { x ) 
'' P{N = n } 


( n = m ) i n (l - z) m 
: P{N = n } 
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的办分布.这点很有价值，它加深了我们的对/?分布的直观认识. ■ 

*6.6 次序统计量 

设 X u X 2 r "， Xjn 个独立同分布的连续型随 机变氬 其公共分布函数为 
F ( x ), 密度函数为 /( x ). 定义 

X (1) = Ai , ，…，中的最小者 
X (2) = &， X 2 , …，中的第二小者 

X ⑸ =&， X 2 , •. ，中的第 j 小者 

X (n) = X 2 ，…，中的最大者 

排序后的 X ⑴< X ( 2 ) < … 《 X ( n ) 称为 Xi , X2 , - - • , X n 的次序 统计量 (order 
statistics ). 换言之， X ⑴， - •. , X („) 是将 X '、…， X n 排序以后的值 • 

现在求 X w ，… , X ( n ) 的联合密度. X (1) , ••- , X ( n ) 的取值为 XI < *2 < • • • < 
的充要条件是存在（1,2,…， n ) 的一个排列 (!,,•••,<„), 使得 
X\ = i <, , Xi = x ia , ■■- , X n = x in 
而对于任何 （1，2，...， n ) 的排列 - , t „), 

P { a ： i , - I < Xi < n , + - - yX in - I < + |} 

« e n fx ,, -, X n ( x il ,--- ,XiJ = e n f ( x il ) --/( XiJ =£ n f ( Xi ) -- f ( Xn ) 

由此可知 

P^Xi - I < x (1 ) < II + !，••• .In - I < X( n ) < In + 2 } 

=P { U {*<. - I < -^1 < *i. + |. • • • - I < ^" < Xi„ + |}} 

= 5 Z - I < < 怎“ + … ’ A "- I < + 5 } 

(“，…， in) 

« ^2 e 2 /( xi ,) • - - f(x in ) = nle n f(xi) - - - f(x„) 

(* 1 ，…， * n ) 

上式两端除以 e " 并令 e — 0, 得 

/ x ⑴， 0ci ，® 2 , …，知） = n !/( a ： i )•••/(；!：„) x 1 < x 2 <-- < x n (6.1) 
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我们可以这样直观地解释 (6.1), 向童〈X⑴,… ,X (n) ) 等于 (Xi,---.Xn) 的充要条 
件是 {Xt, ■■- ,X n ) 等于 ㈨ ，…， or „) 的 n ! 种排列之一 •而 (X u … ,X„> 等于 
( Xl , ■■- ,x n ) 的任一排列的概率（密度）刚好是 /( a ： j )-- /( x n ). 由此,可知 （6.1) 式 
成立 • 

例 6 a 有三个人“随机地分布”在长为一英里的一段路上.找出没有两个人之 
间距离小于 d 英里的概率 （d < 1/2). 


解： 我们假定“随机地分布”是措三个人相互独立地均匀分布在一英里的路段 
上.用表示第 i 个人在路上的 位置. 所求的概率是 P{X (i) > X {i . 1) +d,i = 
2,3}. X ⑴， X W ， X ⑶ 的联合密度为 

/ x ⑴, x a , x s (® i ,®2，： C 3) = 3! 0 < H < a：2 < x 3 < 1 

由密度与概率的关系可导出 

P{X(i) > X (i _ 1 ) + d,t = 2,3} = JJJ fx m , x (2) , x (8) (* i , a ： 2 , a ：3) dii dx 2 dx 3 


=3! 


d rl-d pi 

Jxx+d Jx 2 -\ 


dx3 di2 da：i = 


疒 l -2 d ,1- 

6 /o L 


(1 - d — a ： 2)da：2 dii 


=6 J j V2 dj/2 dxi 

其中，我们作了变置替换 V 2 = \-d-x 2 . 将等式继续下去，得到 

<•1—2d rl—2d 

= 3 / (1 - 2d - ii) 2 dzi = 3 / y? dj/i = (1 - 2d) 3 

这样，当 d < 1/2时，一英里的路段上随机地分布的三个人之间两两最小距离大于 
d 的概率为 （1-2d) 3 . 利用这个方法还可以证明一英里的路段上随机地分布的 n 
个人之间两两最小距离大于 d 的概率为 


[1 - (n - l ) d] n d < - 


其证明作为练习. 


将 （6.1) 式进行积分可求得第 j 个次序统计量尤 ( i ) 的密度 函数. 但也可以用 
下列方法直接推得.= a ： 意味着 •， X „ 中有 j - 1个值小于: r , 有一个值 
等于: E , 有 n - j 个值大于: c . 对于给定的一个变童等于: r , 给定的 J _ _ 1个变童的 
值小于 a :， 其余的变量的值大于； r 的概率密度为 

由于 n 个变量分成三个组的方法有 U _ A1 ) = („_;“)! 种.这样, 
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X U) 的密度函数为 

/X ⑴⑻ = ^ ■ -二 _1)! 陶广 1 1 1 - F ⑻广/⑻ (6-2) 

例 6 b 设&，… , X 2 n +1 为独立同分布的随机变量（统计上称 Xx ,--- , X 2n+ i 
为一个大小为 2 n + l 的样本).次序统计童 X ( n +1) 称为样本中位数.现设 Xx . X2 . X3 
为 (0,1) 上均匀分布的一组样本.求样本中位数落入区间 (1/4,3/4) 的概率. 

解： 由样本中位数的定义可知，本例的样本中位数就是 X (2) . 利用 （6.2) 式， 
X (2) 的密度函数 

31 

fx m ( x ) = - x ) 0< I <1 

因此所求概率为 

只需将 （6.2) 式积分就可得到的分布函数 

Fx » F ( x ))^ f ( x)dx (6.3) 

但是也可用其他方法求得 F Xu ) ( y ), 注意到第 j 个次序统计量小于或等于 j / 的充要 
条件是 X 1 ,--, X n 中小于或等于 y 的个数等于: ;• 或比 j 更多，即 
Fx u ) ( y ) = P { X U) ^ y } = P { j 个或更多不 < y } 

= Y / { l )[ nv )] k [ l - F ( y)] n - k (6.4) 

fc=i 

利用分部积分法，可以证明 （6.3) 式和 （6.4) 式右边的两式是恒等的.如果令 F 为 
(0,1) 上的均匀分布【即 /( a :) = 1,0 < z < 1], 比较 （6.3) 式和 （6.4) 式可得到一个十 
分有用的分析恒等式 

t Gy d - »)“ = (n-JMO-l). r^" 1(i - 1 广 〜 0 « » « 1 ( 6 . 5 ) 
类似于公式 (6.2) 的推导,我们可以求得与的联合分布密度 （i < j ): 

/X(1),Xw){Xi，Xi) = (*-1)!0 -<*- l )!( n - i )! [F(X<)1，_1 (6.6) 

x [ F ( Xj ) - - F ( a : i )] n -- # /( x i )/( x J ) x { < Xj 

例 6 c (随机样本极差的分布）设 A , • •. ,为 n 个独立同分布的随机变量 • 
随机变童= X {n) - X (1) 称为极差 .设不 的分布函数为 F ( x ), 相应的密度函数 
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为/ ㈤ ，则 fl 的分布可通过 （6.6) 式求得.对于 a ^ O , 

P{R 《 a} = P{x^ n) - X (1 ) < o} = JJ /x (1)l x (n) (®1 > *n) d^i din 

n ! 




( n -2)! 

作变童替换 y = F ( i „) - F ( n),dy = /( a : n ) do ;„ ，得 


[ F ( a :„) - F ( x 1 )] n - 2 f { x 1 ) f ( x n ) dx n dx 1 


[ F { x n )- F { x 1 )] n - 2 f ( x n ) dx n = 


V n ~ 2 dy 


因此, 


P{R < a } = n / [ F ( a：i +a)~ F(*i)] n-l /(*i) 


(6.7) 


(6.7) 式右端的积分只在很少几种情况下才能积出来，写成显示表达式.当的 
分布为 (0,1) 上均匀分布时， fl 的分布可由 （6.7) 式算 出来. 对于 a € (0,1), 

P{R < a、 = n j [ F(xi + o ) - F ( xi )] n _1 /( a ： i)dii 

=n f a n ~ l dx\ + n f (1 — *i) n-1 d«i = n(l — a)a n_l + a n 
Jo Jl-a 

将上式求微商可求得极差的密度函数 


/«⑷= 


n(n — l ) o n_2 (l - a ) 0 < a < 1 

0 其他 


即独立的（0, 1) 上均匀随机变量序列的极差的分布是 <8分布，参数为 （ r » - 1, 2). ■ 

6.7 随机变量函数的联合分布 

设 Xl , X 2 具有联合密度函数 fx u x a - 有时我们需要求出 Y u Y 2 的联合分布, 
其中为 X U X 2 的函数.具体地说，设 Vi = gi ( X u X 2 ), Y 2 = S 2 ( Xi , X 2 )， 并 
且函数仍，仍满足下列 条件： 

1. 由下列方程组 

1/1 = 9 i ( xi , x 2 ) 

1/2 =52(^1, *2) 

可唯一地解出 Xi , x 2 即求出 Ii = hi ( yi , y 2), X 2 = h 2 ( yi , y 2) - 

2. 函数 gu 9 2 对一切 ( XLX 2) 具有连续偏导数，并且下面的2 x 2行列式对一 
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切 (*1，®2) 不为0 

dgi 
8 X 2 
dgi 
3 X 2 

在这两条件之下,可以证明 Y U Y 2 的联合密度函数可通过下式 得到： 

fYuYaiVuVi ) = (7.1) 

其中 ； Cl = hi ( yi , y 2), X 2 = h 2 ( i / i , y2 ). 

(7.1) 式的证明可从下式入手 

P { Y \ ^ yi , Y 2 < 1 / 2 } = JJ fxi , x 7 (xi , x 2 ) dii dx 2 (7.2) 



Y lt Yu 的联合密度函数可通过将上式对1/1,的求偏微商 得到. 微商的结果刚好等于 
(7.1) 式的右边.微商的过程作为高等微积分的一个练习本书不再细述.下面通过 
例子来熟悉相应的计算过程. 

例 7a 设 X U X 2 为联合连续的随机 变量， 其联合密度函数为 f Xl ,x 3 - 令 H = 
Xi + X 2 ,Y 2 = Xi - x 2 . 求出 y u y 2 的联合密度函数. 

解：令 0i ( xi , xa ) =*i +* a .» a (* ii * a ) = *i - * a > 经计算 

J(xi,x 2 ) = jj 上 | =_2 

由 = II +®2，!/2 = - 尤2解得 ; Cl = ( l/l + I /2)/2, X 2 = ( j /1 - l /2)/2. 利用 （7.1) 式 

可得 


. dgi dg 2 _ dgi dg 2 
'dxi dx 2 dx 2 9 x \ 


^0 


J{xi,x 2 )= 


dgi 

dxi 

dgi 

dx\ 


/vi ， Yb(yi ， y2) = 5/x,,x a ((yi + ya)/2, (yi - w)/2) 




例如， Xx , X 2 为独立同分布的 (0,1) 均匀随机变量，则 

0 < yi + 1/2 < 2,0 < 1/1 — 1/2 ^ 2 

0其他 

若 X U X 2 为相互独立的指数随机变量，其相应的参数为，则 
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最后，若 Xr , X 2 为相互独立的标准正态随机变量，则 
= 士 e _ l (的你 ) V 8 + ( vn ) V 81 

= l e -( w :+ W )/4 = _ J _ e - v ?/<_ l = e - ,, * /4 
4 n >/4 jt v 4 n 

我们不仅得知 A + Xa 与 X t - X 2 为正态 
随机变量，期望为0,方差为 2( 这一点与 
命题 3.2 的结论相同)，而且， XJX 2 与 
X x - X 2 还是相互独 立的. （事实上，我们 
还可以指出若 Xi , X 2 独立同分布，其分 
布函数为 F ， 则 J ^ + X 2 与 X !- X 3 相互 
独立的充要条件为 F 是正态分布 函数） 

例 7 b 令 { X , Y ) 表示平面上一个 
随机点，并假设其直角坐标入和 Y 是相 
互独立的标准正态随机变量.现在感兴趣 
的是这个随机点的极坐标表示 i ?, e 的联 图 6. 4 随机点 ( X , y ) = ( fl ,0) 

合分布(见图 6.4). 

令 r = gi(x ， y) = + y 2 ,0 = 9^( X >V) ~ tan -1 (y/*), 

dgi x dgx _ y 

~dx ~ y/x 2 + y 2 Q y V x2 + y 2 

~dx = 1 + (y/x) 2 (i 5 *) = x 2 + y 2 ~By ~ x[l + (y/x) 2 ] ~ x 2 + y 2 



由此得 


J { x , y )= 


y 2 


= ( x 2 + y 2 f' 2 + (* 2 + y 2 ) 3/2 = s/x^ + y ，i = r 
由于的联合密度函数为 

/(x,y) = ^e-<- a+ v*)/ 2 

现在求变换 r = y/x 2 +y^,0 = tan _1 (y/;c) 之下 il，0 的联合密度，为了求得（丑， ©) 
的联合密度，我们将 (x,») 平面分 成 4 大块 ， (x > 0,y > 0),(® < 0,y > 0),(® < 
0,y < 0) 和 （z > 0,1/ < 0)，而 r = y /^+y i ,9 = t^-^y/x ) 将 （a; > 0，i/ > 0) 变换 
成 O<0<g,O<r<oo. 现在考虑条件密度 
f(x,y) 


f(x,y\X>0,Y>0) = 


> 0, y > 0 


= P(X >0,y >0) _ n 
在变换 = y / x 2 + Y ^ 和 e = tan -1 ( y l-^) 之下， （ B ， e ) 的条件密度为 
f(r,0\X > 0,y > 0) = -re-T, 0 < 0 < n/2, 0 < r < oo. 
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类似地，我们可以得到 

f ( r ,0 \X < 0 ,y > 0) = ^ re - ^, n/2 <0 <n, 0 < r < oo , 

/( r , 6 \X <0, Y >0) = , n <0< 3 n /2, 0 < r < oo 

f { r ,0 \X <0,y <0) = ^ re ~ r3/2 , 3n/2 < 0 < 2n, 0 < r < oo 

而 ( R ,9) 的联合密度刚好是这四个条件密度的等权加权平均 f 权为即丑= 
VX ^ + Y 2 , Q = arctan ( y / X ) 的联合密度函数为 

f ( r ,0) = 5 ~^ -r * /2 0 < 0 < 2 ji,0 <r <oo 

这个联合密度函数可分解为两个密度函数的乘积，因此，与 e 是相互独立 
的 . e 是( 0 , 2 «)上的均勻随机变貴，而的分布是著名的瑞利分布，其密度函数为 

/( r ) = re _r " 2 , 0 < r < oo 

(例如，当我们关心平面打靶问题时，如果水平和垂直误差是相互独立的标准正态分 
布，则弹着点相对于靶心的方位角不仅仅是均匀分布，而且与弹着点离靶心的距离 
相互独立 0 

上面得到的结果是十分有意义的，因为极坐标的分布与直角坐标的这种关系不 
是一眼就能看出来的. 

如果我们希望求出/? 2 和 e 的联合分布，变换 

d = gi ( x , y ) = x 2 + y 2 9 = 52 ( 1 , 1 /) = arctan ( y / i ) 

的雅可比行列式为 

I 2 x 2 y 

J = —y x =2 

\ x 2 + y 2 x 2 + y 2 

利用公式 (7.1) 可得 

f { d ,9) = 0< d < oo ,0<5<2 n 

由此看出 fl 2 和 e 相互独立， ft 2 具有指数分布，参数为 1 / 2 . 但 fi 2 = x 2 + y 2 ，由 
定义可知， i ? 2 具有 X 2 分布，自由度为 2. 这样，我们验证了自由度为2的 X 2 分布 
与参数为 1 / 2 的指数分布是相同的. 

上面的结果可用于模拟标准正态随机变量.令 U lt u 2 为相互独立的均匀随机 
数（服从 （ 0, 1) 上的均匀分布)，我们将把 u u u 2 转化为两独立的标准正态随机变 
量 Xi 和 x 2 . 在求正态随机变量之前，先求出 { x u x 2 ) 的极坐标表示利 
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用 （ X , y ) 与 (R,G) 之间的关系可知 fl 2 与 e 相互 独立. R 2 = X 2 + Y 2 具有指数 
分布，参数为 A = 1/2.但 -2]nU, 具有这样的分布，对于 a : > 0,有 

P{-2\nUi < x } = P{\nUi > -x/2) = P{Ui > e~ x ^} = 1 - e~ x ^ 2 
另一方面, 2 n i / 2 为 (0,2«) 上的均匀随机变量,利用它可生成 e . 如果令 


R 2 = -2]nUi 0 = 2nU 2 

丑 2 可以看成 ( X lt x 2 ) 到原点的距离的平方， e 就是 ( X l , x 2 ) 的方位角•由 a 
ilcos0 , X2 = flsin 0, 我们得到 


X\ = y/—2lnUi co8(2nt/2) X 2 = y/—2laUi sin(2jrl/a) 


是相互独立的标准正态随机 变量. ■ 

例 7 c 设；(：和 y 为相互独立的 r 随机变量，其参数分别为 （<*, a ) 和 (p,x), 
计算以=久+ 1^和7 = X/{X + Y ) 的联合分布. 

解： X 和 y 的联合密度为 


fx,r{x,y) 


Ae- A *(Ax) Q - 1 Ae- x * , (Ay)^- 1 

:~~ i>j m ~ 


令 gi(x,y) 


- r ⑷ r(/3) 

= x + y,gi(x,y) = a ;/( a : + y )， 可得 


® > 0, y > 0 


dgi _ d£i _ dg2 _ V ^92 _ x 

~dx ~ ~dy ~ dx (t + y) 2 dy (1 + y ) 2 


因此 


J(x,y )= 


由方程组 u = x + y, 


fu,v{^,v ) : 


(i + y) 2 (x + v) a 

x/{x + y ), 得到解 x = uv,y = u(l 
fx,y[uv,u(l - v)]u 


+ y 


-v). 利用公式 (7.1), 
Ae~ Au (Au) a + W-Hl - + 0 ) 

= "— f(^H3) r ⑷ res) 

由上式可知 x + y 与 x/(x + Y) 相互独立 . x + y 具有 r 分布，参数为 （a + 
0,X). X/(X + y ) 具有分布，参数为 ( a ,/3). 由上式还可以看出分布中的归— 
化因子 B ( a ，/3) 为 






T ( a)m 

〜 T(a + ^) 

上面得到的结果很有 意思. 比如，假设共有 n + m 项工作需要完成，完成每项工作 



•/( ii ， … , x n ) 

进一步，我们假定方程组 


Vi = gi { xi ,- - , x n ) 

V2= 92(x1, -■■ ,x„) 

Vn = g n ( xi , ■■- , x n ) 

具有唯一解，即 ： Ei = hl { yi , - , y n ), ■■- ,Xn = - , y n )- 在这些假定之下, 

Yu - ^ Yn 的联合密度为 

fYu-.Yniyu- - ,Vn) = fxu ,x n (xi,- - ,x„)| 7 (ii, ••- ,x n )| _1 ( 7 . 3 ) 

其中; Ej = hi(yi, ■■- > Vn),i = ,n. 

例 7 d 设 A , X 2 和为相互独立的标准正态随机变量,令 K = A + X 2 + 
X 3 , Y 2 = X !~ X 2 , Y 3 = X !- X 3 . 计算 Yi , Y 2 , Y 3 的联合密度. 

解： 计算 Y x , Y 2 , Y 3 相对于 x 1 , x 2 , a - 3 的雅可比行列式， 
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所需的时间服从指数分布,并且完成各项工作所需时间是相互独立的.现在假定将 
这 n + m 项工作分配给两人去完成.甲完成其中 n 件，乙完成余下的 m 件•甲乙 
两人所花费时间分别为 X , Y . X,Y 相互独立，并且其分布为 r 分布，参数分别为 
( n ， A ) 和 （ m ， A ). 甲所花费的时间占总任务时间（即 X + y ) 的比例具有分布，参 
数为 ( n , m ). _ 

现在设 X U … ， X n 的联合密度已经给出，我们希望求得的联合密 
度函数,其中 

••- , X n ) Y 2 = g2 ^ X \,--- , X n ) ••- Y n = g n ( Xi , ••- , X n ) 

其解法与二维随机变量的函数的密度的求法类似.我们假定具有连续偏导数并 
且雅可比行列式 ,••• , x n )^0 对一切 （: n ,…， a :„) 成立，其中 


s:si;l:n 

語 III : ill 
1I71S<§ ilggnlax.1 
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由 X 的表达式可解得 

+ + x 2 = i ( yi -2 y 2 + y 3) + ^ - 2 k 3 ) 

利用 （7.3) 式可得 

fYi.Y2,Y a {y\,y2,y3) = g/x,,X 2 ,Xs ((l/l+l /2 + W3)/3, (i/I- 2y 2 +!/3)/3,(yi +V 2 - 2y3)/3) 
由于 

1 3 

fxi , x 2 , x »( xi , X 2, x 3 ) = (^^)3 exp | - 5^ a ^/2| 

可得 

/vi,Va,v»(yi.V2.l/3) = 3(y^)3 exp { - <3(1/1 ， W ， I/3)/2} 

# 巾 

Q ( yi ^ y 3 )= m + m + m 

=| l/l + \vl + \vl - |卿3 ■ 

例 7 e 令 X U X 2 、“、 X n 为独立同分布的指数随机变董，其参数为 A , 令 
Yi = Xi + X 2 + • • ■ + Xi t = 1 ,••- ,n 
( a ) 求 K ，...， y „ 的联合密度函数 .（ b ) 利用 （ a ) 的结果，求的密度函数. 
解： ( a ) Y 1 = Xi , Y 2 = X l + X 2 , - , Y n = Xi + ■■■ + X n 的雅可比行列式 
为 

1 0 0 0 ••• 0 

1 1 0 0 ••• 0 

J = 1 1 1 0 … 0 


若将该行列式展开，只有第一项非0,因此 J = 1.而&，•••，的联合密度为 

f Xl ，…, ( 叼 , …,*™) = ft Ae-^ = A"e- A (*» + - + -> 0 < x 4 < oo.i = 1, • • • ,n 

i=l 

将方程组1" = & ，… , y n = Xi + ---+ x „ 反解得 

Xi = Yi,X2 = I 2 — Y\, - - - ,Xi = Yi — Vi-i, •• - ,X n = Y n — Y n -i 
最后利用 （7.3) 式，得到 yi ,- -, r „ 的联合密度函数为 
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fYi, -,Y n (Vl^y 2 r ■ ■ ， Vn) 

,X„(l/l>I/2 — 1/1. ,Vi — Vi-W ' il/n — Vn-l) 

=A n exp I - A^yi + [(m - !/i-i)] } 

： X n e~ Xvn 0<yi,0<yi-i/i_i,* = 2, ••• ,n 
=A n e _Aw " 0 < i/i < 1/2 < • • • < i/ n 


( b ) 为求 y „ 的边缘密度，我们必须对联合密度中的其他变量求 积分. 现在— 
个变量―个变量地求积分： 

/y*, "• ，》 (» ， … ， V") = 乂 A n e _Avn dyi = X n y 2 e~ Xyn 0 < 於 < y 3 < …< y n 

进一步对 y 2 求积分，得 


/v 3 ， .".V„(y 3 , … ,Vn) = 


Vwe - 岣” dj/ 2 


0 < 1/3 < 1/4 < • ■ • < Vn 


下一步得到 

f Y ‘,… ,y„(V4, ••,«») = A" Av " 0 <y*< ■■- <y n 

继续下去，最后得到 

/y " ( ^ ) = An (^ T e_AVn 0<Vn 

这个结果与例 3 b 的结果是一致的，即 + + 是 r 随机变量，参数为 ( n , A ). 


*6.8 可交换随机变量 

随机变量序列 X u …， X n 称为可交换的，如果对于1,2,…， n 的每一个排列 

hr " t*m 

P{X tl < x u X h ^x 2l - • ,X in <x„} = P{X\ < xi,X 2 < 勿， … ,X n < a ： n} 
对一切町 ,.... ， z „ 成立 . 换言之， n 个随机变量称为可交换的，如果它们的联合分 
布与这些随机变量的次序无关- 

当为离散型随机变量时，可交换条件可写成 

PjXij =1 2 ,-- =Xn} = P{Xl =Xl,X2=X2,- - , X n = X n } 

对一切排列和一切 Xi , ••- , x n 成立. 它与下列陈述是等价的：分布列 p ( xi , x 2 , ■■- , 
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X n ) = P{Xi t = Xi,X i2 =X2, ■■- , = X n ] 是变量 (Xi, ••- ,X n ) 的对称函数，或者 

说当变量 *!,••• ,X„ 的次序变换以后，相应的概率值不变 • 

例 8 a 设坛子里一共有 n 个球，其中*个球被认为是特殊的球.现在从坛子 
中—个一个地无放回地随机地抽取„个球.记 


Xi 


1 如果第 i 次抽到一个特殊的球 
0 如果抽到的是其他的球 


我们将指出 X lt x 2 ，…、 X n 是可交 换的. 我们需要证明是 (XI,••-, 
Xn) 的对称函数，对于 （町 , … ,X n ), 只要 ！：：《：</ fc , 就必定有 p(Xu- . .，： T „) = 0.因 
此，我们只需对 (xi, •• - , a ： n), nr=i x i = 等于 0 或 1 证明 p ( xi , ••- , x „) 是对称 
函数即可.为了对 p { x x ,---, x n ) 有个直观的了解,取一个具体的向量 （ 1, 1 ,0,1,0, …， 
0 ,1)，其中有*个1，《-；:个0. 


p ( l ， l ，0， l ，0，"，0， l ) 


kk — \ n — kk — 2n — k— \ 
nn — In — 2 n — 3 n — 4 


这个公式比较直观，由于抽取第一个球是一个特殊的球，因此，第一个球是特殊球 
的概率为 k/n, 在第一个球为特殊球的条件 F , 第二个也是特殊球的概率为 - 1)/ 
( n -1), 在第一、第二均为特殊球的条件下，第三个为普通球的概率为 ( n - A :)/( n -2)， 
如此继续下去，把这些条件概率乘起来就得到 p ( l , 1,0,1,0, -,0,1). 这些连乘的 
分数的分母的连乘积为 n(n - 1) • • • 1,其原因是每抽到一个球,坛子里的球就少一 
个.而分子可表示为两部分的乘积，一部分为 k ( k - l )-- l , 另一部分为 ( n - fc )- 
( n _ fc _ l )... l , 这样我们得到 

, 、 k\(n-k)\ n ^ , 

p{x\, - , x „) =-^- Xj = 0,1, > ,Xj = k 


显然， Ph ，…， a ：„) 是的对称函数，即（ X !，… , X n ) 是可交 换的. ■ 


注释现介绍另一种计算 p ( u , ••- , x „) 的方法•将 n 个球编上号，不妨将 fc 个 
特殊的球编号为1,2, . • • ， ifc , 将 n - fc 个普通球编号为 fc +1,…， n . 将球一个一个地 
从坛子里取出来，等价于将这些球排成一个队 *!,••• 第一次取出的是 iu 第二 

次取出的是 i 2 , 等等，显然 (*!,••• , in ) 是一个试验结果.而每一种排列 (*!,••■ , in ) 
的可能性都是相等的.而对于固定的 (XX.X2,- - ,In), 事件 (Xl, - ,X„) 由这样的 
—些试验结果组成， (*!,•••, in ) 中1 ,2,…， fc 的位置与 （ U ，…，〜）中， 
而=1所占的位置相同.显然事件 （ H ，…， Z „) 中，含有(*1, •••,!„) 这样的试验结 
果数为 fc !( n - fc )!, 这样 


若 X U X 2 ，…， X n 为可交换的，很容易得到每一个不具有相同的 分布. 例如， 
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a ■和 y 是可交换的离散随机变量，则 

P{X = x } = Y l P{X = x,Y = y } = ^2 P{X = y,Y = x } = P{Y = x } 

V V 

在例 8a 中，第 i 次抽得的球为特殊球的概率等于 P{Xi = 1} = P{Xi = 1} = k / n . 
直观上也是很清楚的，坛中的 n 个球中的任意一个球在第 i 次被抽到的可能性都 
是一样的，因此, P{Xi = 1} = k / n . 

例 8b 在例 8a 中令 Vx 表示抽到的第一个特殊球所需的抽球个数.令 K 表 
示抽到第一个特殊球以后,直到抽到第二个特殊球所需要的附加抽球的次数.一般 
情况下，令 Vi 表示抽到 i - 1 个特殊球以后，直到抽到第 i 个特殊球所需附加抽球 
次数 , i = 1，…， fc . 例如，如果 n = 4 ,fc = 2 ,Xi = 1, X 2 = 0, X 3 = 0, X 4 = 1, 则此 
时，的 = 1， y 2 = 3. Vi , …， y fc 与 & ，…，具有如下 关系： 


Yi =* 1.^2 = * a . ••- , V * = »k ^ Xi , = X it + i 2 = = 1, 


其他的 


Xj =0 


由上式结合例 8a 的结论可知 

P{Y\ = ii,Yi = *2> • • • I Yk = tfc}= 允！ （ 1! 左 ） • *i + • • • + U < n 

由上式看出， Vi ， …， Vfc 为可交换的.现在把一副扑克牌中 “ A ” 称为特殊的牌, K 表 
示一副洗好的扑克牌中一张一张地发牌，直到第一张 “ A ” 出现为止所发的牌数 . y 2 
表示第一张 “ A ” 以后直到第二张 “ A ” 出现为止所发的附加牌的张数，等等.由于 
vi . va . n . n 是可交换的，因此,所有 V ；的分布都相同 • ■ 

例 8c 下面的棋型称为波利亚瓮模型.设有一个瓮含有 n 个红球， m 个蓝球 • 
每次从瓮中随机地抽取一个球，记下其颜色并放回瓮中，同时还往瓮里添加一个同 


颜色的球.记 


Xi 


1 如果第 j 次抽得红球 
0 如果第: /次抽 得蓝球 


为了对 Xi 有一直观了解，看下面的两个特殊情况 
P{Xi = 1 , X 2 = 1, ^3 = 0, X 4 = 1, x 5 = 0} 

n n+1 m n + 2 m +1 
— n + Tnn + m + ln + m + 2 n + m + 3 n + m + 4 

_ n(n + l)(n + 2) m(m + 1) _ 

— (n + m)(n + m + l)(n + m + 2 )(n + m + 3 )(n + m + 4) 


P{Xi =0, X 2 = 1, X 3 = 0 , X 4 = l , x 6 = l } 


n + 3 n + m + 4 


及 
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__ n ( n + l)(n + 2) m(m + 1) _ 

(n + m)(n + m + l)(n + m + 2 )(n + m + 3 )(n + m + 4) 
—般情况，对任意 xi , x 2 , ■■- , Xk , 其中 r 个1， fc - r 个0， 

P{Xl =*!,••• , X k = Xfc } 


_ n(n + 1 )• • • (n + r — l ) m(m + 1)(m + fc — r — 1 ) 

(n + m) … （n + m + A : — 1) 

由此可知，对任意 fc , 随机变量 X U …、 X k 是可交换的. 

—个十分有趣的结论是，第 i 次抽出一个红球的概率是与第一次抽取的一个红 
球的概率是相同的[等于 n /( r » + m ) j . 我们可以这样直观地看这个原来不很直观的 
问题，设想坛子里原来一共有 n + m 类球，红：，红 2 ,…，红„，蓝 t ，…，蓝 m . 
第一次抽出的球，这 n + m 类球被抽中的概率是一样的.由于这 n + m 类球完全 
是对称的，第二次抽出这 n + m 类中的任意一类的概率是相同的（放回去的另外一 
个球的类别与抽出来的类别被认为是相同的)，这样第 j 次抽出是红球的可能性为 
n/(n + m ). ■ 

最后一个是关于可交换连续变量的例子. 

例 8d 设&，…，为相互独立的 ( 0 , 1 ) 均匀随机数，记 X ⑴，…，尤 w 为 
它们的次序统计量.令 

= -^( l ) Yi = -^(0 — i = 2,…， n 

指出 vi , …，为可交换的. 

解： 考虑 n 维空间中的变换 

Vi =xi,y3 = X2-xi, ■■- ,y n = x„ -x n -i 


其反变换为 

Xi = yi + - i-jji i = 1， • • • ， n 

不难看出这个变换的雅可比行列式为 l , 因此，利用 （7.3) 式，的分布密 
度为 

,y n ) = f{yi,yi + V2, - ,yi + --- + y n ) 

此处 / 是 x (1) , ••- ,x (n) 的联合密度（而不是 x u …， x n 的联合密度)，因此 

> Vn) = «! 0 < yi < yi + V 2 < ••• < J /1 + ■ • • + j/n < 1 

或等价地， 

>Vn) = nl 0 < yi < l,i = l , •■- , n , Vi + • ■ ■ + Vn < l 
从上述表达式看出 f Yl ,-.-,Y n 是 j / i , …， y n 的对称函数，即为可交换的随 
机变量. ■ 
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小 结 

x 和 y 的联合分布函数定义 如下： 

F { x , y ) = P{X ^ i,y < j /} -oo < x,y <oo 
所有关于 x , y 的概率都可以由 f 得到.为了求 a •和 y 各自的分布函数，利用 
尸 x (*) = F ( x , y ) F Y ( y ) = F ( x , y ) 

若 a •和 y 均为离散型随机变量，则它们的联合分布也是离散的， 其联合分布 列为： 
p(i,j) = P{X = i,Y = j) 

A ：, y 的各自分布列为 

P{X = *} = ]^ p ( i , j ) P{Y = j} = ^2p{i,j) 
i < 

随机变 * a •和 y 称为 联合连续的， 如果存在一个二元函数，称 为联合密度函 
Mx , y ), 使得对任意二维集合 c , 

P{(X,Y)€C} = JJ f{x,y)dxdy 
c 

从上式可知 

P{x < X <x + dx,y <Y <y + dy}f^ /(x, y) dx dy. 

若 A ： 和 7 联合连续，则它们各自都为连续型的，且密度函数分别为 
fx{x) = J f{x,y)dy f Y (y) = J f(x,y)dx 
随机变董 X 和 y 称为独立的，如果对任意集合 A 和 S , 有 
P{X €A,YeB} = P{X G A}P{Y 6 B} 

若联合分布函数（或者离散情形下的联合分布列，或者连续情形下的联合密度）可 
以分解为两个因子，其中一个只依赖于: c , 另一个只依赖于 y ， 则 A ■和 Y 独立 • 

--般情况下，随机变量 x u …， x n 称为相互独立的，若对一切实数集山,…， 
An ， 有 

P{X\ € i 4 i , •• - ,A n G i 4 n } = P{Xi e Ai) • ■ ■ P{X„ € A n ) 

若； t 和 y 为独立连续型随机变量，则它们的和的分布函数可以通过下式得到： 
r°° 

F x + y ( o ) = J F x { a - y )/ y ( l /) dj / 

若 ； ^，i = 1, …， n ， 为独立正态随机变量，参数分别为叫和= 1，…， n ， 
则也为正态分布随机变童，参数为 W 和 
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若足 , i = 1,…， n , 为独立泊松随机变量，参数分别为 Ai，i = 1,... , n , 则 
E ? =1 也服从泊松分布，参数为 E?=iAi. 

若 A ■和 y 为离散型随机变童，则已知 Y = y 的条件下 ， X = x 的条件分布列 
如下 定义： 


P{X = x\Y = y} 


P(x,y) 

Pv(y) 


其中 p(x,y) 为 X，Y 的联合分布列. 若 X，Y 的联合连续且其相应的联合密度为/, 
则 X 在给定 Y = y 之下的条件密度函数为 


fx\v(x\y) 


/( 工， y ) 

Mi/) 


设不，…，忍为独立同分布的随机变量序列，将它们进行排序以后得到义⑴< 
X W <---< X ( n ) 称为 Xi ，…， x n 的次序统 计量. 设这些随机变量是连续的，即存 
在密度函数 f(Xi), 则它们的次序统计量的密度函数为 


- . Zn ) = n !/( xi )- -/( a : n ) ii < i 2 < • • • < a :„ 

随机变量序列 Xi ,.-- ,X n 称为可交换的，若对每一个{1，2, . •. ， n } 的排列 i u ■■- , in , 
其相应的 X u ，…， Xi„ 的联合分布是相同的 • 


习 题 

1. 掷两枚均匀骰子，求以下随机变量 x 和 y 的联合分 布列： 

( a ) X 为两枚骰子点数的最大值， y 为两枚骰子点数之和； 

( b ) x 为第一枚骰子的点数， y 为两枚骰子点数的最大值； 

( c ) x 为两枚骰子点数的最小值， y 为两枚骰子点数的最大值. 

2. 坛子里有5个白球和8个红球，从中无放回地随机取出3个球.如果第 i 次取出的球是 
白色的 ，令不 等于1,否则等于 0. 求以下联合分布列： （ a ) Xx,Xr, ( b ) X U X 2 ，X 3 . 

3 . 在习题 2 中，假设白球标有数字号码，如果第 i 个白球被取出，那么令 K 等于1,否则 
等于 0. 求以下联合分布列： （ a ) Yi,Yr, ( b ) Yi ,Y 2 ,Y 3 . 

4. 在有放回情形下重做习题 2. 

5. 在有放回情形下重做理 3( a ). 

6. 己知5个元件里有2个是失效的.现进行检测，每次随机地从未检测的元件中取出—个 
进行检测，直到失效的都査出来为止.记表示第-个失效元件被检测出时的检测次 
数 ，记的 表示其后直到第二个失效元件被检测出时的附加检测次数.求和 AT 2 的联 
合分布列. 

7. 考虑一列独立伯努利试验，每次成功的概率为 P . 令 Xi 表示第一次成功前失败的次数， 
令表示前两次成功之间失败的次数，求 Ax 和的联合分布列. 
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8. 设 X 和 y 的联合密度函数 如下： 

/(*.») = c ( y a - * 2 ) e -# - y <*^ y ,0< y<oo 

( a ) 求 c 的值 ：（ b ) 求 X 和 y 的边缘 密度； （ c ) 求 E[X\. 

9. 设 A ■和 y 的联合密度函 数为： 

/(*.») = f (* 2 + 0 <*< 1 , 0<»<2 

( a ) 证明上式确实是联合密度 函数； （ b ) 求 A " 的密度 函数； （ c ) 求 P{X > y }; 
⑷ 求 P {y > ⑷求 ( f > 求 B [ y ]. 

10. A •和 y 的联合密度函数 如下： 

/( i , y) — e -( * +v) 0^ i < oo ,0 ^i / <oo 


求⑷ P{X < Y}\ ( b ) P{X < a}. 

11. 某电器商店店主统计在进入该店的顾客中，45%的顾客会购买一台普通电视机，15%的 
顾客会 购买- 台等离子电视机，剩下40%的顾客只是看看，不会购买.如果某天有5名 
顾客进入该店，问该店将要卖出2台普通电视机和1台等离子电视机的概率是多大. 

12. 某个小时内，进入药店的人数为参数 A = 10的泊松随机变量，求在该小时内己有10个 
女士进入该店的条件下，至多有3位男士进入该店的条件概率.其中作了何种假设？ 

13. 某男和某女约好下午12点半在某个地点见面.如果男士到达的时间服从12点15到12 
点45之间的均匀分布，而女士到达的时间服从12点到下午1点之间的均匀 分布. 且两 
者的到达时间相互独立.求先到达者等待时间不超过5分钟的概率.乂该男先到达的概 
率是多大？ 

14. 一辆救护车沿着长为 L 的道路来回匀速行驶，假定某个时刻亊故发生的地点服从均匀分 
布[即，亊故发生地点与道路端点的距离服从 (0, L ) 上均匀分布].假设亊故发生时救护车 
的地点也是服从均匀分布，并与事故发生地点独立，那么求救护车与亊故发生点的距离分 
布. 

15. 随机向量 (X,Y) 称为服从平面区域 fl 上均匀分布，若其密度函数具有下列形式 


( a ) 证明 1/ c 等于区域 K 的面积. 

假定 （ X , y ) 在边长为2,中心为 (0,0) 的正方形区域内服从均匀分布. 

( b ) 证明 x 和 y 相互独立，且都服从 (-1,1) 上均匀分布 • 

⑹求 (X,Y) 位于以原点为圆心，半径为1的圆内的概率，也即，求 P{X 2 + Y 2 < 1} 的 

概率. 
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16. 在一个圆周上随机独立地取 r » 个点，求它们正好 
在一个半圆周上的概率（也即，我们要求可以从圆 
心画一根直线，这些点恰好都在这条直线的同一 
边的概率).令 Pi , -,Pn 表示这 n 个点，令>1 
表示亊件“所有的点恰好位于某个半困上”，令 A 
表示事件“处 于以只 为起点，顺时针方向的一个 
半圆周上”. 

( a ) 将亊件用亊件 A , i = 1，_ • - , ri 表示出来； 

( b ) Ai 之间是否互不相容？ 

( c ) 求 P ( A ). 



17. 从一条直线 L 上随机取 X lt X 3 , X 3 三个点， 求 X 3 在 Xi 和 X 3 之间的概率. 
is . 在一条长为 l 的线段的中点两边分别随机取一个点（也即两个点 a •和 y 为相互独立随 
机变量，且 X 在 (0. L /2) 上均匀分布，而 y 在 ( L /2. L ) 上均匀分布)，求这两点之间距 
离大于 L /3 的概率. 

19. 证明 /(®,y) = 1/*,0 < 1/ < * < 1为-联合密度函数.假设/为X和V的联合密度函 
数，求 


( a ) Y 的边缘 密度； （ b ) 久的边缘密度： （ c ) E [ X ); ( d ) E \ y ). 
20. X 和 K 的联合密度函数 如下： 


/(*.») = 


xe ~ lx+v) 

0 


*>0,y >0 

其他 


问 A ■和 y 是否独立？如果 f ( x , y ) 由下式给出呢？ 


/(*.») 


0<ar<y,0<y<l 

其他 


21.令 

{ 24xy / <l,0^i + y<l 

0 其他 

( a ) 证明 /(*,») 为一联合密度 函数； （ b ) 求 £[ X ] ; ( c ) 求 £[ y ]. 


f (. x , y ) = 


22. X 和 y 的联合密度函数 如下: 


f ( x , y ) 


Jx + y 

1 ° 


0<*<l,0<y<l 

其他 


( a ) X 和 y 是否独立？ （ b ) 求久的密度 函数； （ c ) 求 P{X + y <1}. 
23 . a ■和 y 的联合密度函数 如下： 




12xj/(l - x) 
0 


0<x<l,0<y<l 

其他 
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(a) X和 y 是否独立？ ㈤求 £(X); (c) 求 E ( Y )\ 

(d) 求 Var(X ); ⑷求 Var(V). 

24. 考虑独立重复试验，每次结果是 i 的概率为 Pj) * = 0,l,- - , k , ZUoPi = 1.令尺表示 
结果第一次不等于0时的试验次数，令X表示该结果 • 

(a) 求 P{JV = n}，n>l; 

(b) 求 P{X = j},j = 1,…， fc; 

(c) 证明 P{N = n , X = j } = P{N = n } P { X = j }-, 

(d) 对你来说， W 独立于 X 是不是很直观？ 

(e) 对你来说，X独立于 7V 是不是很直观？ 

25. 假设10 6 人到达某个服务站的时间为独立随机变童，且服从(0,10«)上均匀分布（单 位： 
小时).令；V表示在第一个小时内到达的人败•求 P{N = i } 的近似值. 

26. 假设 A , B , C 为独立随机变童，且均服从 （0,1) 上均匀分布 • 

(a) 求 A, B,C ■的联合分布函数. 

(b) 求方程 Ax 3 + Bx + C = 0 的所有根都是实数的概率. 

27. 如果随机 变量； G 和；^相互独立，且分别服从参数为和 A 2 的指数 分布. 求 Z = 
Xi/X a 的分布，且计算 P{Xi < X 2 }. 

28. 修理-•辆汽车所需时间是服从指数分布的随机变量，参败为 A = 1. 

(a) A. J. 在时刻 0 送到修理站一辆待修的车，而 M. J. 在时刻 t 送来一辆待修的车.问 
M. J. 的车先修好的概率是多少？（假定每辆车送到修理站的时候就立刻开始修理，并 
且两辆车的修理时间是相互独立的 .） 

(b) 现在假定 A. J. 和 M. J. 同时把车送到修理站，而只有将 A. J. 的汽车修理完以后才 
开始对 M. J. 的车进行修理•问在 t = 2以前将 M. J. 的车修好的概率有多大？ 

29. 某个餐馆的周销售额为一正态随机变量，均值为2200元，标准差为230元，求以下亊件 

概率： 

(a) 下两周内总销售额超过5000元. 

(b) 下三周内至少有2周的周销售额超过2000元. 

你做了何种独立性假设？ 

30. 吉尔的保龄球得分近似服从均值为170,标准差为20的正态分布，而杰克的得分近似服 
从均值为160,标准差为15的正态分布.如果杰克和吉尔毎人玩一局，并假设他们的得 
分为独立正态随机变童，求以下亊件的近似 概率： 

(a) 杰克得分高一些. 

(b) 他们两人的总得分超过 350. 

31. 根据美国国家徤康统计中心数据，25.2%的男性和23.6%的女性从来不吃早餐，随机选择 
200个 男士和 200个女士的样本，求以下亊件概率的近 似值： 

(a) 该400人中至少有110人从不吃早餐 • 

(b) 不吃早餐的女性数不小于不吃早餐的男性数- 

32. 某杂志的每一页上打印错误的期望数值为 0.2, 那么一篇10页的文章有 （a) 0 个； （b) 2 
个或以上的错误的概率分别是多大？解释理由. 
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33. 全球范围内，商业航线的飞机坠毁事故每个月平均有 2.2 起,求以下事件 概率： 

( a ) 下个月内超过 2 起这样的 事故； 

(b) 下两个月内超过4起这样的 事故； 

( c ) 下三个月内超过5起这样的 事故. 

并解释理由. 

34. 吉有两件事情需要完成，设这两件事情为1和 2. 对于每件亊情，吉试图用1小时完成， 
但能够完成的概率分别为 pi ( pi = 0.3 ,pa = 0.4), 若一小时内不能完成，则需从头开始，再 
用1小时来完成这件亊情 .问： 为完成这两件亊情，共用去12小时（或以上）的概率有多 
大？ 

35. 在习題4中，求以下条件下的的条件分 布列： 

( a ) X 2 = 1： ( b ) X a = 0. 

36. 在习题 3 中，求以下条件下的 Yi 的条件分 布列： 

( a ) Y a = l ; ( b ) V 3 = 0. 

37. 在习题 5 中，求以下条件下的 Yi 的条件分 布列： 

( a ) y 3 = l ； ( b ) y 2 = o . 

38. 从数集 {1,2,3,4,5} 中随机选一个数 X , 再从集合 (1,2, ; X } 中随机取第二个数，记为 
Y . 

( a ) 求久和 y 的联合分布列； 

( b ) 在 y = i 的条件下求久的条件分布列，<=1,2,3,4,5, 

( c ) X 和 y 是否独立？为什么？ 

39. 掷两枚骰子，令 a ■和 y 分别表示最大点败和最小点数，求已知 x = i 的条件下 y 的条 
件分布列，* = 1,2,"• ,6. x 和 y 是否独立？为什么？ 

40. x 和 y 的联合分布列 如下： 

p(l ， l) = | p(l,2)=i P(2,l) = i P(2,2) = i 

( a ) 己知 y = i 的条件下求 X 的条件分布列 ， i = 1,2. 

( b ) A •和 y 是否独立？ 

( c ) 求 P{XY < 3>, P{X + y > 2}, P { X/Y > 1>. 

4 1 . x 和 y 联合密度函数 如下： 

f { x , y ) = xe — (v+1) x >0, y >0 

( a ) 求给定 Y = y 的条件下 X 的条件密度，以及给定 X = x 的条件下 V 的条件 密度； 

( b ) 求2 =久7的密度函数 • 

42. X 和 V 的联合密度 如下： 

/(* i ») = c ( x 2 - y 2 ) e~ z 0^ x < cx >,- xK ： y^x 
求给定 X = x 的条件下 y 的条件分布. 
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43. 某保险公司假设每个人都有一个事故参数，而且亊故参数为 A 的人每年发生亊故的次数 
服从泊松分布,均值为 A . 他们还假设一个新投保的人的参数值$ r 随机变量, r 随机变 
童的分布参数为 (s,q). 如果新投保的人在第一年内发生了《次^故,求出他的事故参数 
的条件密度，并求他在下一年发生亊故数的期望值. 

44. 如果 XuX ^ Xi 为独立随机变量，且都服从 (0,1) 上均匀分布，求三者中最大数大于其 
他两数之和的概率. 

45. 一台复杂的机器只要其5个发动机里至少有3个正常工作，这台机器就正常工作.如果 
任何一个发动机正常工作的时间为一随机变量，其密度函数为 /(*)=® e -, x > 0 . 计算 
这台机器正常工作时间的密度函数. 

46. 设3辆卡车抛锚的地点随机独立地分布在长为 L 的公路上.试求任意2辆卡车的抛锚地 
点的距离均大于 d 的概率，其中 d < L /2. 

47. 从 （0, 1) 上均匀分布中随机抽取5个样本值，计算其中位数落在区间 (1/4,3/4) 内的概 

率. 

48. 设 XuX ^ Xa . X ^ Xs 独立同分布，且服从参数为 A 的指数分布.求 
( a ) P { min ( Xi , Xa ,• • • , X5 ) < a }, ( b ) P { max ( Xi , Xa , • • • , Xs ) < a }. 

49 . 设 X ⑴,;…，; ^是 （0,1> 上 n 个相互独立的均匀分布随机变量的次序统计董.求 
在给定 = si , X ( 2 ) = * a , ••- = a n -i 之下 X („) 的条件分布. 

50. 记 z u z , 为相互独立的两个标准正态随机变置.令 x = z,,v = Zi + z 2 , 证明具 
有二元正态分布. 

51. 从密度函数为 /( a :) = 2*,0 < i < l 的分布中，取容童为 2 的样本，试求出此样本的极差 
的分布. 

52. 在以原点为圆心，半径为1的圆内随机取一点，令 X 和 V 分别表示该点的两个坐标，也 
即其联合密度为 

/(*.») = ^ * 2 + V 2 < 1 

求极坐标 R = ( X s + Y a ) I / a 和 e = arctan ( y / X ) 的联合密度函数. 

53 . 设； C 和 Y 独立，且均服从 (0,1) 上均勻 分布. 求 fl = VX i + 和 © = arctan ( y / X ) 
的联合密度函数. 

54. 如果 （/ 服从 (0,2 ji ) 上均匀分布，而 Z 与 [/ 独立，服从参数为1的报数分布，直接证明 
(不用例 7 b 的结果）如下定义的 x 和 y 

X = y /2 ZcoeU Y = y /2 ZsmU 

为相互独立的标准正态随机变量. 

55. X 和 y 联合密度函数为 

/( x >») = ^ 

( a ) 求= Xy 和 V = X / Y 的联合密度函数. （ b ) 求它们的边缘密度. 

56. 设 X 和 y 独立同分布，其公共分布为（0, 1) 上均匀分布，求以下随机变量的联合 密度： 
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(a) U = X + Y,V = X / Y -, { Y >) U = X,V = X / Y -, ( c)U = X + Y,V = X/(X+ Y ). 

57. 在为独立指数分布情形下重做习题 56, 且指数分布参数为 1. 

58. 设 Xi 和 X 2 独立，且均服从参数为 A 的指数分布，求 Vi = + X 2 和 y 2 = e x > 的联 

合密度函数. 

59. 设独立同分布，分布密度为 /(*) = e—,0 <; e < oo , 推导 C/ = ；f + y,V = 

X + Z,W = Y + Z 的联合分布 • 

60. 在例 8b 中，令 y fc+ i = n + 1 - Yi , 证明 Yi , - , Y k , Yk+i 可交换. 

提示： 令 為 =y* _ l,i = 1， … ，fc +1. 厶表示取到第 i 一 1 个特殊球与取到第 i 个特殊 
球之间取到普通球的个数， i = 1，…， Jfc. z k+i 表示取到第 fc 个特殊球以后剩下的普通球 
的个数.取球的次序，刚好是将 n 个球随机地排成一列 ，而厶 刚好是那些特殊球之间普 
通球的个数.然后证明 ^,* = 1, • ,fc+l 的分布是可交换的 ■ 

61. 坛子里有 n 个球,标有号码1,假设从中随机取出 fc 个，令不=1,如果标有数宇 
t 的球被取出，否则等于0•证明 X u …， X n 可交換 • 

理论习题 

1. 驗证 （1.2) 式. 

2. 假设给定时间周期内亊件发生的个数为参数 A 的泊松分布随机变童.亊件一共分为 n 类， 
毎个亊件厲于第 i 类的概率为 = - - ,n，EPi = l- 并且每一事件的分类不依赖于 
其他事件的 分类. 证明发生的类型为 i 的亊件败 (*=!.••• >") 为相互独立泊松随机变 
童，参数分别为 Api.i* 1, ••- ,n. 

3. 给出方法利用蒲丰投针问题来估算 n 值. 令人惊异的是，这曾经一度是估算 it 值的常用 
方法. 

4. 当 L > D 时求解蒲丰投针问题 • 

解答：|^(1-如幻+ 20/51，其中0满足《»0 = 0/1 ( . 

5. 如果； T 和 y 为独立连续正随机变量，求以下随机变量的密度函数（假定的密度函 
数己 知)： 

(a) Z = X / Y -, (b) Z = XY . 

并在 A ■和 Y 都是指数随机变童的特殊情形下求出以上的密度函数 • 

6. 设为联合连续，其联合密度函数为 fxY { x , y ), 证明 X + K 为连续的，并且其密度 
函数为 +oc 

fx+Y(t) = J fx,r(x,t- x)dx 

T. (a) 如果 X 服从参数为 （t, A) 的 r 分布，求 cX 的分布函数 (c>0)； 

(b) 证明 ^ xln 服从参数为 （A A) 的 r 分布，其中 n 为正整数， xi* 为自由度 2 r» 的X 2 
分布随机变量. 

8.令X和 y 为相互独立连续随机变量，危险率函数分别为 Ax ⑴和 Ay ⑴. 令= 
min ( X , V ). 
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( a ) 假定 X , Y 的分布函数己知，求 IV 的分布 函数； 

( b ) 证明 VV 的危险率函数 A W ⑴由下式给出 

Xw { t ) = \ x { t ) + Ay ( t ). 

9. 令 X u …， X „ 为独立同分布随机变置，分布为参数入的指数分布.求 min ( X ,,--. , X „) 
的分布函数. 

10. 电池的寿命为独立指数分布随机变童，参数都为 A . 某个手电简工作霈要2节电池，如果 
某人有一个手电简，和《节电池，那么该手电筒能工作的总时间的分布是什么？ 

11. 令 X U X ^ X 3 , X 4> X S 为独立同分布连续随机变量，其公共分布函数和密度函数分别为 
F 和 /. 令 

1 = P{Xi <X3<X3<X4< Xs } 

⑷证明 J 与 F 无关： 

提示： 将/写成5维积分，且作变童 替換： u 1 = F (* 4 ).< = 1.--,5. 

( b ) 求 J 的值. （ c ) 给出 （ b ) 的答案的直观解释. 

12. 证明联合连续（离敗）型随机变量 X u - -, X n 相互独立当且仅当其联合密度函数（分布 
列 )/( 幻，… •， a ： n ) 可以写成 

/(*!,••• ,X n ) = 

其中 9i ( x),t = 1, • •• , n 为非负函数. 

13. 在例 5 d ® 中，试验成功的概率被看成随机变置.在该例中，我们计算了在 n + m 次试验中 
有 n 次成功的条件下，试验成功概率的条件密度.如果我们指明了哪 n 次试验成功，相 
应的条件密度会不会改变？ 

14. 假设； C 和 Y 为独立同分布几何随机变量，参数为 p . 

( a ) 不用任何计算，你认为以下的值是多少？ 


P{X = t|X + y = n } 

提示： 假设连续掷一枚硬币，正面朝上的概率为 P . 如果第二次正面朝上发生在第 r » 
次投掷，那么第一次正面朝上的时刻的分布列是什么？ 

( b ) 验证 （ a ) 的猜测. 

15. 设一独立试验序列中，每次试验成功的概率为 P . 己知第 n 次试验的结果为第 fc 次成功 • 
指出前 n - 1次试验的各种可能的结果是等概的（每 个 结果为 fc - 1次成功和 n _ fc 次 
失敗组成的一个序列). 

16. 如果 A ■和 Y 为独立同分布二项随 机变氣 参数为 ( n , p ), 用分析的方法证明，给定 X+Y = 
m 的条件下 X 的条件分布为超几何分布.另外，不用任何计算给出此结果的另一种解释. 
提示： 考虑掷 2 n 枚硬币，令 X 表示前 n 个硬币出现正面朝上的枚数， Y 表示后 n 枚硬 
币出现的正面数.说明在给定有 m 次正面朝上的情况下，前 n 枚硬币出现的正面数与从 
n 个白球 n 个黑球里随机抽取 m 个球，其中的白球数是同分布的. 


①原文写成了例 5 c , 有误.一译者注 
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17.设 X t (i = 1,2,3) 为独立泊松随机变量，参数分别为 Ai，i = 1,2,3. ♦ X = Xi + Xt 
且 y = X 2 + X 3 , 随机向量 （ X , V ) 称为脹从二元泊松 分布. 求其联合分布列，即求 
P{X = n, V = m}. 

is . 设； f 和 y 均为整数值随机变量.记 

p(*li) = P(x = %\Y = j), g (j|i) = = i) 


证明 


P[X = i,Y = j ) = 


pm 
v pWj ) 
Y 丽 


19. 令 X u X ： i ， X 3 为独立同分布连续随机变量，计算 

⑷ P{Xi > X 2 \Xi > X 3 }; (b) P{Xi > Xa|Xi < X 3 >; 

(c) P{Xi > Xi \ X-x > &}; ⑷ P[Xi > X ,\ X 2 < X 3 ). 

20. 令 1/ 表示 (0,1) 上均匀随机变量，计算下列条件下的 t/ 的条件 分布： 

(a) U > a ; (b) U < a , 其中 0 < o < 1. 

21. 假设给定某天内，空气中的水分含置 W 为参数 （t,/3) 的 r 随机变量，也即，其密度为 
/(«,) = ^e- <,u, (/3u))*- 1 /r(t).«» > 0.给定IV = w, 假定当天内亊故发生次数 W 服从参 
数为 w 的泊松 分布. 证明给定 JV = »i 的条件下，IV的条件分布为参数 （t + n,；8+l) 的 
r 分布. 

22. 令 W 为參数 （t,/3) 的 r 随机变置，并假设在 W = w 的条件下， Xi ， Xi ，...， X „ 为独立 
指数型随机变置， 参数为 U). 证明，给定沁=II, X a =*2, -; , X n = x n 条件下 ，灰的 
条件分布为 r 分布，参数为 {t + n,0 + Y ： i = iXi )- 

23. mn 个数的矩阵抹成了 n 行，每行 m 列，如果有一个数，既是该行的最小值，又是该列的 
最大值,那么就称它为韁 A( saddlepoint). 比如，在以下的方阵中 


1 3 2 

0-2 6 
0.5 12 3 

第1行第1列里的1便是一个鞍点 • 鞍点的存在性在博弈论里是一个很重要的问题.考虑 
一个如上所述的关于数的矩阵，并假设有两个人 A 和 B 进行如下 游戏： A 从 1,2,_ -，n 
中抽取 -数， B 从1,2，.. .， m 中抽取一数.并规定它们同时宜布自己的选择，如果八抽 
到了 i 而 B 抽到了 j , 那么 B 将付给 A 的钱数为该数阵里的第 i 行第 j 列的数.假设 
该阵有一个鞍点，不妨假设为第 r •行第 fc 列，该数为这样，如果 A 抽取了 r , 那么 
他可保证至少赢得 因为; rwc 为第 r 行里的最小数，如果他选择其他行，就不能保证 
至 少贏得 Irfc ), 另一方面，如果 B 抽取了 fc , 那么他可保证至多输掉 X rfc (因为 IWc 为 *： 
列中的最大数，如果 B 选择其他列，他输的钱可能更多 •) •由于 A 有方法可以保证他至少 
贏得 3 V * ，而 B 有方法可保证他至多输掉 A *， 因此，该策略对两人来说是最佳的 - 

如果该矩阵里的 nm 个数是从任意一个连续分布里独立抽取的，那么该阵具有鞍点 
的概率是多大？ 
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2 4 •如果 X 服从指数分布，参数为 A , 计算 P {[ X ] = n , JJf - [ J > f ] < x }, 其中记号 【》] 定义为 
不超过 a : 的最大整数.你能推导出[ X ]同 X — [ X ]是独立的吗？ 

25 •假设 F ( x ) 为一分布函数，证明当„为整数时，以下都是分布 函数： 

⑷ F "( x ); ( b ) 1-[1- F ( x )]». 

提示：令 ，…，为独立同分布随机变量，其分布函数为 F •用；来定义随机变量 
1" 和 Z , 以满足 P{Y <*} = F "(*), 且 />{Z < a :} = 1 - [1 - F ( rr )】' 

26 - 证明 ：如果 n 个人随机分布在长度为 L 英里的路上,那么两两之间的最小距离大于£>英 
里的概率为 [1 - (n - l ) D / L ) n , 其中 彡 L /( n - l ). 如果 D > L/(n — 1) 呢？ 

27. 通过对公式 (6.4) 求微分，建立公式 (6.2). 

28. 证明 ：取自 （0,1) 均匀分布的 2 n + l 个相互独立的、样本的中位数服从0分布 ，参数为 

(n + l,n + l). 

29. 验证公式 （6.6) 是和；的联合密度. 

30. 求密度函数为/的连续分布的 n 个样本的极差的密度. 

31•令 X ⑴< X <2) < ._• < X („) 为 n 个相互独立的 (0,1) 上均匀随机变量的次序统计量. 
证明，对 l </ fc<n + l , 有 

P i X W - x ( k - l ) > t } = ( l - t) n 
其中久⑼三0, Jf ( B + i ) = 1®. 

32. 令 , X „ 为一列独立同分布连续随机变量，分布函数为又令 X w ,*= l, …， n 
表示相应的次序统计童，如果 X 独立于 X 4 ,* = I ,-- - , n , 并且也具有分布计算 

( a ) P { X > X ( n ) y , ( b ) P [ X > X w )i ( c ) P { X W < X < X u) }, 1 < t < j < n . 

33 . 令 X lt ■■- , X n 为独立同分布连续随机变置，分布函数为密度函数为 /. 随机变童 
M = \ X w + X { n ) ]/2 定义为其最大值和最小值的平均值，称为中程.证明它的分布函数 
为 

Fjtf(m) = n J [F(2m -x)- F^x)]^ 1 f(x)dx 

34 . 令 Xr ，…， X n 为 （0, 1) 上独立均匀随机变置.令= X (n) - X w 表示极差 ， M = 
[ X (n) + X w }/2 表示中程，计算和 M 的联合密度. 

35•令 X 和 y 为相互独立的标准正态随机变童，计算以下随机变童的联合 密度： 

u=x v =^ 

然后利用此结果证明 X / Y 具有柯西分布. 


自检习题 


1. 掷一枚非均匀骰子，每个奇数面1，3, 5朝上的概率为 <7,每个偶数面朝上的概率为 2 C . 
( a ) 求 C 的值. 


①原文误写成 X (n+1) = t . ——译者注 



( b ) 投掷这 枚骰子 ，令 
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X = 


1结果为偶数 
0其他 


Jl 结果大于3 
\ o 其他 


求 x 和 y 的联合分布列. 

现在假设独立投掷12次《子. 

(c) 求 6 个面中的每一面正好出现 2 次的概率. 

⑷求其中点数为1或2的有4次，点数为3或4的有4次，点数为5或6的有4次 

的概率. 

(e) 求至少有8次点数为偶数的概率 • 

2. 随机变量 x , y , z 的联合分布列 如下： 


p(l,2,3)=p(2, 1， 1) = p(2, 2, 1) = p(2,3,2) = i 


求⑷ E\XYZ\. (b)E[XY + XZ + YZ]. 

3. A ■和 y 的联合密度如下 


/(*. v) = C(y- x)e~ v -y < x <y,0 <y < oo 


(a) 求 C; (b) 求久 的密度 函数； （ c) 求 y 的密度 函数； 

⑷求 ⑷求 E \ y \. 

4. 记 r = ri + ... + »•* ，其中 r •，为正整数.证明，若 A ，…，具有多项分布，则 Vi ,..., h 
也具有多项分布，其中 

U-1+U 

Yi= X jt i^k 

上式中约定为 0,如此定义的 Yi 表示， Vi 是前面 n 个； ^ 的和，妁是接下来 r 2 个 
Xj 之和，等等. 

5. 设 Z 为独立随机变量，每个都等可能地取值1或2,求以下随机变量的概率分 布列： 
(a) XYZ; (b) XY + XZ + YZ-, (c) X 2 + YZ. 

0. 设 A •和 Y 为连续型随机变童，其联合密度为 


f(x,y) = 



0<x<l, l<y<5 
其他 


其中 c 为一常数. 

(a) C 的值是多少？ （ b ) ■和 y 是否独立？ ㈦ 求 P{x + y > 3}. 
7. x 和 y 的联合密度为 


/(*.») = 


xy 

0 


0<x<l, 0<v<2 
其他 


⑷ X 和 y 是否独立？ （ b ) 求 X 的密度 函数； （ C ) 求 y 的密度 函数; 
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( d ) 求联合分布 函数； ⑷求 £[ y ]; ( f ) 求 P{X + Y <1}. 

8 . 假设有2个元件和3种撞击，其中第一种撞击将引起第一个元件失效，第二种揸击引起 
元件2失效，第三种撞击将导致两个元件都失效.等待三种揸击的时间为独立指数随机 
变量,参数分别为 AuAa 和 A 3 .令表示元件 i，i = 1,2失效的时刻，随机变 ft Xi ，: V 2 
称为服从联合二元指数分布.计算 P { X t > S , X 2> t }. 

9. 假设一分类广告册有 m 页，其中 m 充分大.假设每页的广告数量是个变量，而且你要知 
道某页上有多少广告唯一的方法就是直接计数.还有，假设页数足够多，你无法直接数出 
到底有多少广告.你的目标是想随机选择一个广告以使得任何一个广告被选中的可能性 
是一样的. 

( a ) 随机挑选一页，然后随机从中选择一个广告.这样是否达到了你的目标？为什么？ 

令 n ⑷表示第 i 页上的广告数 i = I ,... , m . 尽管这些数 n ( i ) 是未知的，但我们仍 
假定它们都小于或等于某个给定的值 n . 考虑如下选择广告的 法则： 

第1步随机选择一页，假设页敫为 X ,直接数出该页上的广告数以得到 n ( X ); 

第2步以概率 n ( X )/ n 决定是否继续考察第 X 页，如果决定继续考察第 X 页, 
转向第3步，否则回到第1步《 

第3步在第页上随机选择 • 个 广告 • 

毎经过“第1步” -•次称为一次循环.比如，第1步随机选择的页码被拒绝继续考察, 
而第二次选择的页码接受了，即转入第3步，那么我们需要两次循环才能得到一个 
广吿. 

( b ) 一次循环就能得到第 i 页上广告的槪率是多大？ 

( c ) 一次循环就能选中一个广告的概率是多大？ 

( d ) 通过 fc 次循环才选中了第 i 页上的第 j 个广告的概率是多大？ 

( e ) 通过法则，第 i 页上的第 j 个广告被选中的概率是多大？ 

( f ) 通过法则，循环的次数的期望值是多大？ 

10 . 在自检习题8中的“随机”部分可通过 (0,1) 均匀随机变量实现. 

第1步产生一 （0, 1) 均匀随机数 t /, 令 X = [ ml /] +1,找到久页上的广告数 n ( X ). 
(其中 M 表示不超过: c 的最大整数，或的整数部分 .） 

( a ) 解释为什么上述算法实现了自检习题 8 中的第1步？ 

提示： X 的分布列是什么？ 

( b ) 写出实现自检习题8中其余各步的算法. 

11. 令 Xi , X 3 , - , X n 为一列 （0, 1) 上独立均匀随机变 
鼉，对于-个给定常数 c , 定义如下随机变霣：尺= 
min{n : X „ > c }, N 是否独立于 X N 1 即如果知道第 
—个大于 c 的随机变量的值，是否影响这个随机变量 
发生时刻的概率分布？给出您的答案的直观解释 • 

12 . 右图中的镙靶是个边长为6的正 方形. 中间有三个半 
径分别为1, 2, 3的同心 圆圈. 如果镙落入半径为1的 
圆内，那么得分为 30. 如果落入半径为1的圆外，但是 
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落入半径为2的圆内，得分 20. 如果落入半径为2的圆外,但是落入半径为3的圆内，得 
分为 10. 其他情况得分为 0. 假设你每次掷镖与前面的结果都是独立的，落点均匀分布在 
该正方形内，求以下亊件 概率： 

( a ) —次投银得分 20 ; ( b ) —次投镙得分至少为20: 

( c ) 一次投镖得分为0: ( d ) —次掷镙的期望得分值； 

( e ) 两次掷領每次得分至少为10: ( f ) 两次掷镙后总得分为 30. 

13. NBA 篮球赛中有这样的规律：两支实力相当的球队比赛的时候，每节主队得分与客队得 
分之差为正态随机变量，均值为 1.5, 方差为 6. 并且，假设4节的比分差是相互独立的. 

( a ) 主队胜的概率为多大？ 

( b ) 在前半场主队落后5分的情况下，主队得胜的概率为多大？ 

( c ) 在第一节主队贏5分的情况下，主队得胜的概率为多大？ 

14. 令； V 为几何随机变量，参数为 p . 假设己知 N = n 的条件下 X 的条件分布为参数为 
( n , A ) 的 r 分布.求己知 X = x 的条件下尺的条件分布列. 

15. 令 X 和 y 为 (0,1) 上相互独立的均匀随机变最. 

( a ) 求= X，V =久+ Y 的联合密度. （ b ) 利用 （ a ) 得到的结果求 V 的密度函数. 

16. 你和其他三个人正参与一个项目的竞拍，竞价高者获胜.如果你中标，便计划立即将此项 
目转售，售价为10 000美元.如果你认为其他人的竞价是独立的，且在7000到11 000 
美元之间均匀分布,你如何竞价才能使得期望获益最大？（如果你中标,你必须将此项目以 
你的出价买下 

17. 设 U 2 , . . . , X „ 为独立随机变量，且 

⑷均为等可能取1,…， n 中任一值 .（ b ) 具有分布列 P{Xi = J >= Pi,j = l ,2,-, n . 
分别在以上两种情形下，求出；^，久 2 ,... , X „ 恰为1,2,- - , n 的一个排列的概率 • 

18. 令； , X „ 和 K ,-.. , V n 为相互独立随机向量，其中每个向量都是 fc 个1和 n_fc 
个0的随机排列.也即，它们的联合槪率分布 列为： 

P { X , =*!,••• , X „=»„} = P{yj - ,Vn = tn } = l /( j ) ti =0, l ， Xjti = fc . 

♦ N = E 7 =i \Xi - Y t \ 表示两个向量的分量取不同值的坐标数，而且，令 M 表示满足 
Xi = i , y ; = o 的 i 的个数 . 

⑷求 iV 和 M 的 关系； （ b ) 求 M 的 分布； （ c ) 求⑷求 Var ( JV ). 

•19. 令 U 3 ，…， Z „ 为独立标准正态随机变量，且令的 = 

( a ) 求办= J /的条件下的 S „ 的条件分布 ， fc = 1， 2 ,…， r »; 

( b ) 证明： 对于1彡 fc < n , 已知 S n = x 的条件下， Sfc 的条件分布为均值 xk / n , 方差 
fc(n - k )/ n 的正态分布. 

20 . 令 X u Xf 为一列独立同分布连续随机变釐，求 

( a ) P { X e > Xi\Xi = max ( Xi ,, X 5 )}; ( b ) P { X 6 > X 2 \Xi = max ( Xi ，… , X 5 )}. 
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7.1 引 言 


本章中，我们将进一步讨论期望的性质.对于离散型随机变量 X ,它的期望由 
下式 定义： 

E[X] = Y^ X P^ X ) 

其中 pOr ) 是 X 的分布列.对于连续型随机变童， X 的期望由 
E[X] = J xf(x)dx 
定义,其中 / Oc ) 是久的密度函数 ■ 

由于 E[X] 是随机变置 A ： 的所有可能取值的加权平均, E[X] 的值必定介于 X 
的两个极值之间.因此,我们有如下结论，若 

P{a^X^b) = l 
则 

a< E[X\ < b 


我们在离散情形下证明此 结论. 由 P{ a < X 在 6} = 1可知对于一切 x g [ a , 61,均 
有 p (; r ) = 0,因此 

E[X\ = ^2 xp(x) ^ a P( x ) = a x 51 P( x ) = a 

z:p(x)>0 *:p(*)>0 i:p(*)>0 

利用类似方法可证 E [ X ) < b . 这样，我们在离散情形下证明了 a < E [ X ] < b . 连续 
型情形下的证明完全类似,细节从略- 


7.2 随机变量和的期望 

第4章的命题 4.1 和第5章的命题 2.1 给出了随机变量的函数的期望值的计 
算公式.此处，我们将这个公式推广到二元函数的 情况. 设 X 和: K 为随机变量, 5 
是一个二元函数. 
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命题 2.1 若 X ， y 具有二元分布列 p (; r , y ), 则 

E \ g ( X , Y )\ = ^ / '^2 g { x , y ) p { x , y ) 
v * 

若 X , y 具有联合分布密度 / Or ， y ), 则 

E \ g { X , Y ))= f f g ( x , y ) f { x , y)dxdy 
J—oo J—oo 


我们在 { X , Y ) 为连续情形和 g ( X ， Y ) 为非负情形下证明此命题•由于 g ( X , Y )^ 
0,利用第5章的引理 2.1, 可得 

E \ g ( X , Y )]= f°° P { g ( X , Y )> t}dt 
Jo 

将概率 

P{g(X, y) > t} = ff f(x,y) dydx 

JJ (x,y) ： g{x,y)>t 


代入期望公式，得 

£[s(X,y)] = 厂 ff f(x,y)dydxdt 

Jo J J [x,y):g(x,y)>t 

将上述的三重积分交换积分次序，得 

/ oo roo rgi,x,v) 

/ / /(i.y)dtdydx 

-oo J —oo </t=0 

= J J 9{x,y)f{x,y)dydx 


这样，我们证明了当 g { X , Y ) 为非负随机变量时 E [ g ( X , X )) 的计算公式. g ( X , Y ) 
为一般情形下，可参考-维情况 处理. （参见第5章的理论习题 2 和理论 >] 题 3) 

例 2 a 设在长度为 L 的一段路 [0, L ] 上某一点 X 处发生了车祸.在发生车祸 
的同时，在 [ o , l ] 的某一点 y 处有一辆救护车.假定都是均匀地分布在地段 
10,勾上，并且相互独立，求事故地点和救护车之间的平均距离- 

解： A •和 y 之间的平均距离就是 E【|X - VII ，由于 ( X , y ) 的联合密度函数为 
f ( x , y ) = 0< x < L , 0< y<L 

由命题 2.1 可知， 


E [\ X - Y \\ 



|i-y|dydi 
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经计算， 


\x~ y\dy = 


(a: - y)dy + / (y - x)dy 






从而 


E[\X-Y\} = 


hL ( 


T " 


作为命题 2.1 的重要应用，我们得到如下的结果.设和 E[Y] 均有限，令 
g(x,y) = X + Y. tE (X,Y) 为连续的情况下，利用命题 2.1 可得 

E[X + Y] = r f °° (x + y)f(x,y)dxdy 

J —oo J —oo 

roo roo too too 

=I I xf(x,y)dydx+ / / yf(x,y)dxdy 

J —OO J — oo J— oo J— oo 

=/! xMx)dx+ r yMy)dy=e[x]+e[y] 

—般情形下，结论 成立. 因此，当邱¥)和 E[Y\ 均有限时， 

E[X + Y] = E[X) + E[Y] (2.1) 

例 2 b 设随机变童 a ■和 y 满足如下关系 


X^Y 

即对于任何试验结果，随机变童 A " 的值永远大于等于随机变童 y 的值.因此，对 
任何试验结果， x - Y -^ o 永远成立，由期望的定义可知， E [ X - r ]> 0 或等价地 
E[X}^ E[Y] a 

由 （2.1) 式，通过归纳法可知，对于任何一组随机变量 Xi,i = l ,2,---, n , 只要 
他们的期望均有限,就有下式 成立： 

E[X x + -.. + X„] = £[Xi] + ••• + E[X n \ (2.2) 

公式 (2.2) 是一个十分有用的公式，下面一系列例子说明了其有用之处 • 

例 2 c (样本均值） 设； ... ，为独立同分布的随机变量序列，其公共分布 
函数为尸，期望值为这样的序列称为来自分布尸的一个样本.由下式 


定义的文称为样本 均值. 计算 E[X\. 
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m Ap]MiA 

这个公式说明，样本均值的期望值等于其分布的均值.在统计中，分布的期望值通 
常是未知的，而样本的均值就作为 / i 的估 计值. ■ 

例 2 d (布尔不等式）设糸，…， i 4„ 为 n 个随机事件，记 X<，i = 1,…， n 为这 
些事件的示性函数， 


Xi 


木发生 

其他 


记 x = sr=i Xi , 刚好是这一系列事件在试验中发生的次数，令 

y - l 1 X>1 

其他 

故当 A“i = 1,.-- ,n 中至少有一个事件发生时， V = 1,否则 r = 0. 由此立即可知 
X > K 从而 E [ X ] ^ _ c [ y ]. 由 

即 = 闷=亡 / »(▲) 


E [ y ] = 中至少有一事件发生 } = p ( U a O 

i=l 

可知，布尔不等式成立，即 

i=i <=i 

下面的3个例子说明 （2.2) 式可用于二项分布，负二项分布和超几何分布的期 
望公式的 推导. 将现在的方法与第4章中的方法进行对比，可显示出公式（2. 2 )的 
优越之处. 

例 2 e (具有二项分布的随机变量的期望公式）设 X 的分布为二项分布，其参 
数为 ( n , p ). 注意到 X 是 n 次独立重复试验中的成功次数，而每次成功的概率为 P , 
我们可将 X 写成 


X = Xi + X2 + — + X n 
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其中 


Xi 


第 i 次试验成功 
第 i 次试验失败 


因此 ，不 是一个伯努利随 机变氩 其期望 E [ Xi ] = 1 xp + O x (1 - p ) = p .因此 


E [ X ) = B [ Xi ] + E [ X 2 ) + • • • + E [ X n ] = np _ 

例 2f (负二项随机变量的期望公式）设在一独立重复试验序列中，每次试验 
成功的概率为 p , 记 X 为试验序列中直到 r 次成功所需的试验次数.现在希望计 
算 X 的期望值. 

解： 可将 X 写成下列表达式 


X = Xi + X3 + • • • + X r 

其中 X :表示达到第一次成功所需要的试验次数， x 2 表示在试验序列中达到第二 
次成功所需的附加次数，表示第 i - 1次成功以后，为获得第 i 次成功所需的附 
加试验次数.稍加思索，就可得到结论，的分布是参数为 P 的几何分布•由第4 
章的例 8 b 可知 E [ Xi ] = l / p,i = 1,…， r . 因此 

E [ X ] = E [ Xi ] + E [ X 2 ) + • • • + E [ X r ] = r/p _ 


例 2 g (超几何随机变童的期望）设坛子内有 W 个球,其中 m 个白球，从中随 
机地取 n 个球，求取出白球个数的期望值. 

解： 记 X 为取出的白球个数， A •可以表 示成： + + 其中 


Xi 


1第 i 个白球被取出 
0其他 


现在， 

E [ Xi ] = P{Xi = 1} =户{第 i 个白球被取出 } = (]；) ( nZl )/( n) =n/N 


因此 


E [ X ] = BJXi ] + •■• + E [ X m ] = 

我们也可用另一种表示方法求得此 结果. 随机变量久可表示成 


其中 


X = Y \ + • ■ ■ + Y n 


fl 第 i 次选出的是白球 
{ o 其他 
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此处的 i 是第 i 次抽取的意思，而前面中的 i 是第 i 个白球的意思，两者含义不 
同 ■由于 AT 个球中的每一个球被第 i 次取出的概率都相同，因此五闪= m / iV ， 故 
E[X) = £[yi] + • • ■ + E[y n ] = nm/AT ■ 

例 2 h (配对的期望数） AT 个人首先把他们的帽子丢在某房间内，将帽子充分 
混合以后，又让每一个人随机地取一顶轜子，求选中自己帽子的人数的期望值. 

解： 记 X 为选中自己帽子的人数， A •可 写成 ： X = X 1 + X 2 + ... + ；^, 其中 
v fl 第 i 个人选中自己的帽子 

Xi = < 

lo 其他 

对于每一个人来说选中任何一顶帽子的可能性是相同的，因此 
E{Xi] = P{Xi = 1} = ^ i = l， …， AT 

这样 

E[X] = E[Xi] + + E\X n \ = ixAT = l 

因此,平均来说,只有一•个人能拿到自己的帽子. ■ 

例 2 i (优惠券的收集问题）设一共有； V 种不同的优惠券，假定 有一人 在收集 
优惠券，每次得到一张优惠券，而得到的优惠券在这 W 种优惠券中均匀地分布.求 
出当这人收集到全套 iV 张优惠券的时候，他收集到的优惠券张数的期望值. 

解 ：记； C 表示这人收集到全套优惠券时所收集的优惠券的总数.我们利用例 
2 f 中的方法来计算•记表示第 i 种优惠券己经收集到，为收集到第 i + 1 
种优惠券所需要的附加次数.注意 X 具有如下表 达式： 

X — Xo + X \ + …+ Xn-i 

设有 i 种优惠券己经收集到，则下-次收 集到- 张新的优惠券的概率为 ( N - i )/ N . 
这样，的分布为几何分布，即 

P{ Xi =k}=^(^y 1 k>\ 

因此， E [ Xi ] = N/(N - i ), 由此可得 



例 2 j 10个猎人等待一批野鸭飞过，当一群10只野鸭飞过猎人头顶时，10个 
猎人随机地瞄准一只野鸭并同时射击.设每位猎人击中野鸭的概率为 P , 求逃过这 
一劫的野鸭数的期望值. 
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解：记 


1第 i 只野鸭逃过这一劫 
0其他 


于是， 

E [ X ) = E[Xi + …+ Xi 0 ]= E [ X t ] + ••• + E [ X l0 ] = 10£[ Xi ] 


其中， X 表示逃过这一劫的野鸭数， E [ Xi ] = P{Xi = 1} 表示1号野鸭未 
被击中的概率.每位猎手是否击中 i 号野鸭是相互独立的，且概率为 p /10, 因此, 
P{Xi = 1} = (1- p /10) 10 , 从而 E [ X ] = 10(1 - p /10) 10 . ■ 

例 2 k (游程的期望数）设有 n 个1和 m 个0随机地排成一个序列，一共有 
(n + m )!/( n ! m !) 种不同的排列法.假定每种排列法都是等可能的.在一个排列中， 
连在一起的1构成“1”的 游程. 例如,《 = 6，饥= 4,6个1和4个0构成如下的一 
个排列：1, 1, 1, 0, 1, 1, 0, 0, 1, 0,其中第一组3个1构成一个“1”的游程,在这个 
序列中一共有3个“1”的游程.我们感兴趣于计算游程的个数的期望值•记 fl ( l ) 
为排列中“1”的游程的个数，记 


\\ 一个1的游程开始于第 i 个位置 
= \ 

lo 其他 

这样 i ? ⑴可表 示成： i ?( i ) = E ?=, m A , 从而 

<=1 


经计算， 

E [ Ii ] = P { u l n 在第一位置 } = 

对于 1 < i <n + m , 

E [ Ii ] = P { a 0 n 在第 i - 1 个位置， “1” 在第 i 个位置 } 



这样， 


E [ R ( l )) = 


- + (n + m — 1) 


(n + m)(n + m — 1) 


n(m + 1) 



类似地，关于 “0” 的游程的个数的期望， 
E [ R (0)] = 

以及关于总的游程的个数的期望， 


m(n + 1) 
(n + m ) 


E [ fl ( l ) + ii (0)] = 


2 mn 
m + n 
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例 2 丨 （ 平面上的随机徘徊）设在平面 
坐标系的原点上放一质点，质点在平面上 
作如下的随机 徘徊. 每一步质点移动一个 
单位距离，且前进方 向与; r 轴的夹角0在 
(0,2«)上均勻分布.（见图 7.1.) 计算在走 
了 n 步以后，质点离开原点的距离的平方 
的期望值. 

解：用 ( x 4l y <) 表示第 i 步移动后，坐 
标的变动童，因此 

Xi = cos Oi Yi = sin 0 i 



图 7.1 平面上的随机徘徊 


其中 0 <，i = 为相互独立，且在 （0,2 ji ) 上均匀分布.经过 n 步以后，质点 

的位置为质点离幵原点的距离的平方以的公式为 


° 2 = (E^) 2 + (E y< ) 2 = +^ 2 )+E 

»=1 »=1 «=1 

=n + y ^( cos0jcos Oj +sin 氏 sin 没 j ) 


注意,此处利用了公式 cos 2 氏+ sin 2 氏= 1. 在求 D 2 的期望时,利用氏之间相互独 
立性假设以及 

2 ji £[ cos0j ] = / cos udu = sin 2 n : — sin 0 = 0 
Jo 
产 

2 n £[ sin ^ i ] = / sin udu = cosO - cos 2 n : = 0 


最后得到 E[D 2 ] = n. m 

例 2 m (快速排序算法）假设有一组互不相同的数: n ，...，〜• 我们需要将它 
们排成一个上升的序列，称这一过程为排序.通常采用-个快速排序程序来完成这 
一任务，其方法 如下： 当 n = 2时，只需直接比较这两个数并且将他们排成升序即 
可.当71 > 2时，随机地选一个数，设为而，然后将所有其余的 数与； Ci 作比较，将 
小于而的数 归入而 左边一集合，将大于的数归入: Ci 右边一集合，然后对于那 
些数的集合重复刚才的处理过程，直到所有的数都己排成升序为止.例如，下面是 
10个不同的数 


5,9,3,10,11,14,8,4,17,6 

开始时从中随机地选一个数（每一个数被选中的概率都为 1/10) 比如说选中了 
10,然后每一个数与10做比较，这样得到 


{5,9,3,8,4,6}，10, {11，14, 17} 
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现在我们对于不是单点集的数集进行再 分类. 例如先对上述左边的集合进行再分 
类, 随机地选定一个数，例如6被选定，然后将数集中其余的数与 6 作比较,得到 
{5,3,4}，6, {9,8}，10, {11，14, 17} 

现在，我们还是考虑最左边的非单点集合，将它的元素进行 比较. 最左边的非单点 
集合为 {5,3,4}, 从中随机地取出一个数，例如4,这样,经过排列以后得到 
{3}，4, {5}，6, {9, 8}, 10, {11，14, 17} 

重复这个过程直到每个花括弧中只有一个数为止.这样快速排序法也就完成了 ■ 

在排序过程中，最基本的运算是比较两个数的大小.记 X 为实现排序所需的 
比较的次数，则 E[X ] 是一个排序算法的效率的一个度 ft , 为计算我们首先 
将 X 写成一列随机变量 的和. 为解决这个问题，首先将最小值命名为1，将第二小 

的值命名为2, . ,将最大值命名为 n , 对于 i < j , 记 

fl 在排序过程中，直接比较过 

心 ) H 甘灿 

lo 其他 

由排列过程可知，任意两个数 i 和在排序过程中，有可能从未比较过，但若 
它们直接比较过,只可能比较—次，不可能再次比较，这样，由 X 的定义 可知： 

± Hu) 

i=l j=i+l 

由此推得 

1 i=l j=i+l i=l J=»+l 

f 和 j 在排序过程中直接进行比较过} 

i=l j=<+l 

现在需要计算概率 

和在排序过程中直接比较过 } = 

考虑数集合 i,i +1， • • •，丄 一共有 J-i + l 个元素.最初它们全包含在一个大的集 
合中， 用一个花括弧将这个大集合括起来.在排序过程中，随机地选定一个比较点， 
若这 V 比较点不在此区间内，即比 i 小，或比 •? •大，则此时数^不会直接进行比 
较，在比较后重新排序时，它们还是处于同一花括弧内.现在假定选择的比较点巧 
入^合 i.t + l. - .i-l.j 之中，则只有当选择点为 i 或:?•时， i 和 J 才会直接进行 
比较，否则它们与比较点比较后，将分别放进左、右的花括弧内，而不会直接相互比 
较•因此, i ， j 直接进行比较的概率，就是从 M + 1，- 1， J _ 中选取 i 或 J 的概 
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率，等于 2/ ij-i + l ). 

将得到的公式代入 E[x\ 的表达式后，得到 e[x] = Er^E^i+i 
现在当 n 充分大时,利用近似公式 

= 2ta(l - i + 1)l - 

= 2 ln(n — t + 1) — 21n2w2 ln(n — t + 1) 


这样， 


E[X\ w ^2ln(n — t + 1) « 2 J ln(n — x + l)di = 2y lny dj/ 

= 2(j/lny_y)|; « 2nlnn 


由此可知，利用快速排序法，当 n 充分大时，大概进行了 2 nlnn 次比较，可将 n 个 
数进行排序. ■ 

例 2 n (事件和的概率）记七，…，匙为 n 个事件， X u …， X n 是它们的示性 


函数 


fl 4发生 
| o 其他 


注意 


n ( u ) 

>=1 


1 u 次发生 
0其他 


因此 


sfi-na-xo] = p(ija < ) 

i=l «=1 


将上式左边展开 

p ( yA i )= B [^^- EE x< ^ + EEE x ^ Xk 

、 i=l i=l i<j i<j<k 

—— + (-l) n+1 Ax … ； f„] 


由 


- - - x ik 


1 •Aijijj …^发生 
0 其他 


(2-3) 
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可知 E [ Xi , - •• X it ]= PiAi , -- A ik ), (2.3) 式变成大家熟知的事件和容斥公式 

p ( u ^)= E p w-EE p ^ A i )+EEE p ( A ^ k ) 

* *<j i<j<k 

- ■■■ + (- l ) n +1 P ( A 1 - A n ) m 

现设不 (i > 1) 是一个随机变量序列，每一项具有有限期望，下面的公式却不 
是无条件成立的， 

£ [ E^]=£W (2-4) 

在下列的一系列等式中，打问号“？”的一处 1 是 （2.4) 式成立的关键. 

7 . » » ( 2 . 5 ) 

i=l t=l 

问号是指期望运算和极限运算是否可以交换的问题.若两个运算可交换，则 
(2.4) 式 成立. 在一般情况下，这种可交换性是没有得到证实的.但是下面两种重要 
的特殊情况下， （2.5) 式中的两种运算的可交换性是得到保障的. 

1. Xi 均为非负随机变量（即 P{Xi >0} = 1对一切 i 成立) • 

2 . HZxE[\X i \}< 0 o. 

例 2 o 考虑非负整数值随机变童 X ,对一切^ 1，定义 

X i =( 1 X>1 
[0 X <i 

我们得到 

oo X oo X oo 

J2x i = , £x i + Xi = E 1+ E 0 = x 

i=l i=l i = X+l i=l i = X+l 

由于&都是非负随机变量，因此 ％ 

E [ X ) = f ； EiXi ) = Y J P { X ^ i ) (2.6) 

这是一个非常有用的恒等式. 1_， " ■ 

例 2 p 设有 n 个对象，记为1,2,…， n •这 n 个对象被放在计算机的 n 个单 
元中，他们顺次放在序号为的单元中，其中 { ii ，…， M 为{1，2,…， n } 
的一个排列.现设每次从这 n 个对象中随机访问一个对象，并且每次访问与过去的 
访问历史是相互独立的.现设访问对象 i 的概率为 P (*)， Er = i^W = l . 假定尸⑷ 
为已知.现在的问题是什么样的单元摆放次序，能够使得每次访问的对象所处的单 
元序号的期望值达到最小. 
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解： 不妨设这 n 个对象的访问概率满足条件 P ( l ) > P (2) > ^ .我 

们指出这些对象的最优摆放次序应为 O 0 = {1,2,•••,«}. 记 X 为被访对象在计 
算机中所处的单元的序号，对于对象1,2,…， n 在计算机中的单元任一排序 O = 

{ il ， … ， in }: 

Po{X >k} = ^2P(ij) > Y,P(j) = Pi, 2 ,- , n {X>k} 
j=k j=k 

由此利用公式 (2.6), 可得 E 0 (X) > 本问題的结论指出应该把最经常 

访问的对象放在最容易访问的单元.这样的系统设计，操作起来最顺手，访问的期 
望时间也最短. ■ 

•7.2.1 通过槪率方法将期望值作为界 

通过在集合上引入概率，可分析集合中元素的性质.在第3章例41中已经看 
到了该方法的应用.在本节中，我们将找出某些函数的界. 

设/为定义在有限集上的函数，我们对该函数的最大值感兴趣 
m = n^c /(s) 

令 S 为取值于 > S 的随机元，显然，由 m > f ( S ) 知 m > E [/( S)j •当 f ( S ) 不是取常 
数值时，上述不等号是严格意义下的不等号，即不会出现 m = E [ f { S )} 的情况•总 
之， B 【/( S ) j 是 m 的下界. 

例 2 q (竞赛中的哈密顿路径数的最大值）在循环赛中， n 个竞争对手中任意 
—对都进行比赛，一共进行⑵场比赛，现将运动员编成号1,2,••- , n , 下面的情 
形形成 哈密顿 路径: »!,••• , t n , 如果 ii 胜 i2 , i 2 胜 i 3 , 如此下去,直到 i „- i 胜 in . 
一个问题是求哈密顿路径的最大可 能数. 

作为解释，设《 = 3,如果有一个人胜了 2次，此时，只可能有一条哈密顿路径， 
例如，1胜了 2和3, 2胜了 3,则唯一的哈密顿路径为1，2, 3. 另外，若在循环赛中 
没有人贏得2次，即每人胜负各1次，1胜2, 2胜3, 3胜1，此时，哈密顿路径的条 
数的最大值为 3. 

我们将指出对于参赛人数为 n 的比赛中，哈密顿路径可多于 nl /2"- 1 条•由 
于一共要进行场比赛，比赛的结果一共有 2(2) 种，记 S 为这2⑵个不同的比 
赛结果之集合，记 /( s ) 表示比赛结果为 s 时的哈密顿路径的数目 ， s e 5,为证明 
max /( S ) > 我们随机地抽取一比赛结果 s , s € 5,且 S 取每一个 s e 5的概 

率都是相等的,并假定这 g ) 场比赛是相互独立的，每个选手对等可能地打败对方. 
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现在将 n 个竞争者进行排队，一共有 n !种不同的排列,例如 i 2 ，…、表示竞争 
者的排列，其中 ii 排第一位， i 2 排第二位…，将这些排列进行编号， i = l , 2, •••,«!. 
为了简化叙述，我们用 ii — i 2 表示“在与 i 2 的比赛中胜出.对于确定的比赛结 
果，只有 h — i 2 — … — i n ，排列⑷，…， i „) 才是哈密顿路径.记 


Xi 


1若竞赛的结果使排列 i 成为哈密顿路径 
0其他 


显然依赖于比赛结果 S , 是一随机变量，并且哈密顿路径数 


故 


nl 

ns) = ^ x < 

<»i 

五 [/( 列 = 


对于 Xi , 其中 i 为某一排列，不妨设 i 为（1,2,"_ ， n ), (1,2, •••,«) 成为哈密顿 
路径只有1胜2, 2胜3,…，故 E [ Xi ] = P{Xi = 1} = l /2 n ~ l . 由此可知 
E [ f ( S )} = n \{\/2) n - 1 . 由于 f ( S ) 不等于常数，故存在一个试验结果其哈密顿路 
径数超过 nl /2"- 1 . ■ 

例 2 r —共有52棵树排列在一个圆周上，有15只金花鼠，生活在这些树上, 
指出存在相连的7棵树，其上生活着至少有3只金花鼠. 

解： 将一棵树和顺时针方向的另外6棵相邻的树组成该树的一个邻域.现在 
我们需要 证明： 对于生活在这52棵树上的15只金花鼠，不论它们如何分布，我们 
总能找到一棵树，使得至少有3只金花鼠生活在这个树和它的邻域中.为此，我们 
随机地选一棵树，并且数一数这棵树和它的邻域中的金花鼠的数目，记这个数为 X . 
显然， X 是一个随机变量，现在将这15只金花鼠记为 i = 1，2，".，15,记 


Xi 


1金花鼠 i 在这个随机选定的一棵树的邻域里 
0其他 


显然 X = E!=i 从而 E [ X ) = E != i 五[不 】. {Xi = 1} 表示随机地选定的 7 棵树 
上生活着金花鼠 i , 显然 = P{Xi = 1} = 7/52,从而 E [ X ] = 15 x (7/52) = 

105/52 > 2. 由此可知，必定存在一棵树，使得在这棵树的邻域里生活的金花鼠数 
目大于 2. ■ 


*7.2.2 关于最大数与最小数的恒等式 


下面是关于若干数的最大值，最小值的一个恒等式. 
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命题 2.2 对于任意一组数 XX , 下列恒等式 成立： 

maxxj = n — min ( z “ Xj ) + min ( xi , Xj , x ^) 

* i *<j i<j<k 

+ •• +(- l ) n+1 min ( a：i ，- •- , x n ) 


证明： 我们给出一个概率的证明.首先，假定所有的;^在 [0,11 区间内，令 t / 
为 （0, 1) 上均勻分布的随机变量，记事件 A i = { U < x i ), 不难验证 


U A * = {£/ < maxxj } 

因此， 

P { = P{U < maxxi } = maxzi 
及 

P(Ai) = P{U < Xi] = n 

此外，事件 A ix ,---, A ir 同时发生的充要条件是亊件 {£/ < x it }，j = 1，…， r 同时成 
立，由此导出 

• Air = {y < i= min ^1<,} 

进一步得 

■ ■ ■ Ai r ) = P{U < ^jnin ^ 

由事件和的概率的容斥 公式： 

p ( U ^) = E p (^)- E p (^) + E 

i t i<j i < j<k 

+ ■ + (- l ) n + 1 P { A 1 - A n ) 


可得到该恒等式. 

现在设: Ci 为非负，但不限制于单位区间.设 c 为常数,使所有而均小于 c ， 此 
时恒等式对于讲= au / c 成立，再在恒等式两边乘以常数 c , 可知恒等式对〜也成 
立.现在 假定而 可取负值，此时,存在6,使得 A + fcX ) 对一切 i = l , … ， n 成立 • 
这样，下列恒等式成立 

max(xi + 6) = + 6) — ^ nxin(ii + b,Xj + b) 

' i i<] 

+ ••• + (-l) n+1 min(ii + 6, • • • , x n + 6) 

记 M = E i ® i - E i <； jmin (; c < ， a : i ) + ... + (- l )" +1 min ( z 1 ，...， a :„)， 可将上面的恒等 
式 写成： 


maxxi + i > = M + 6 (n _ (;) + ••• + ( _ l ) n+1 (:)) 
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但是下面也是一个恒等式 

0 = (l-l)" = l-n+O+ — + (-l) n ( ； J) 

将上面的两个恒等式合并便得 

maxx « = M 

这样，证明了本命题所列的恒等式对一切 々 (i = 1,…， n ) 都成立. □ 

由命题 2.2 知，对任意随机变置 Xi ，… , X n ，有 

mpXj = min ( Xi , X ，.）+ … + (- l) n+1 mind ，…， X n ) 

1 » «i 

将上式求期望，可得 

£[maxXi] = 5^£ ； [Xi] - ^^[min^i.X,)] 

' » *<i 

+ ■•• + (- l ) n +1 E [ min ( A - i .---, X n )) (2.7) 

例 2 S (不等概率的优惠券收集问题）现设某人收集优惠券，每次收集一张，均 
独立于以前所收集的优惠券.现设一共有 ri 种不同的优惠券，每次收集的时候，优 
惠券 i 被收集到的概率为 Pi ， Er=iPi = l - 求出当第一次收集到全套 n 种优惠券时 
所收集到优惠券总数的期望值. 

解：记 为收集到第 i 种优惠券时所收集到的优惠券张数，记 X 为收集到全 
套 n 种优惠券时所收集到的优惠券总数. X 与 之间有如下的关系 


由于收集到一张第 i 种优惠券的概率为 p <, 兄的分布是以 P< 为参数的几何分 
布.又由于 minfXi . Xj } 是为了收集到第 i 种优惠券或第 j 种优惠券所需收集的 
优惠券的张数，因此的分布是以 Pi + Pj 为参数的几何分布.类似地, 
min ^ i . Xj . Xk ) 的分布是以 Pi + Pj + Pk 为参数的几何分布，利用 （2.7) 式以及几 
何分布的性质可知 

E[x)='y-~yi—^— + Yl 1 1 i 


注意到 
并利用恒等式 
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关于 £[ X ] 的等式可以化成下面更便于计算的公式 
E [ X ] = 


7.3 试验序列 中事件 发生次数的矩 


上一节中的许多例子都具有下列 形式： 对于给定的事件序列 . 求 


出 E [ X ], 其中 X 是这些事件在试验中的发生次数.其解法是给出每个事件的示性 


函数 


Ii 


1 A 发生 
0其他 


利用关系式 x = e ?=, a . 可得 

E [ X ) = 叫 = E p ⑷ (3-1) 

<=1 <=1 i=l 

现在我们感兴趣于“事件对”出现的次数.若冷与禹在试验中出现，则 
Ii - Ij = 1 , 反之，则 Ii lj = 0 , 因此，在试验序列中， U 山 是事件对出现的次 

数.又由于 X 是试验序列中事件出现的次数，因此亊件对出现的次数为这 
样’ . E 砧 

i<j 


在上式右边的和项中，一共有项.上式两边求期望，得 


^[(2)] = E Wii = 

«i i<i 

* ^]-En 钩 

*<) 

由此得到 

E [ X 2 ] - E [ X } = 2 Y J P { A i A j ) 
i<i 

进一步可得到 B [ X 2 1 和 Var ( X ) = E [ X 2 ] - { E [ X ]) 2 的公式. 

进一步，考虑在试验序列中， it 个事件组的出现次数，可得到 


© 


a ,/« 2 ••• 


(3.2) 


(3.3) 


两边求期望得到 
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£ [®] = E 即 A … E … 4) (3-4) 

例 3 a (二项随机变量的矩）考虑 rz 次独立重复试验，每次成功的概率为 p , 记 
A 为第 i 次试验成功这一事件，当 i / j 时，尸(4為) sp 2 , 由 （3.2) 式得到 

啦 ) 卜 2>H;V 

i <3 

或 

E [ X{X - 1)] = n(n - l ) p 2 


或 


E [ X 2 ] - E [ X ] = n ( n - l ) p 2 
再利用 E [ X \ = P ( j 4<) = np , 可得 


Var ( X ) = E [ X 2 \ — ( S [ X ]) 2 = n(n — l ) p 2 + np — ( np ) 2 = np(l — p ) 


这个结果与 4.6.1 节的结果相同. 

一般情况下，利用 P ^ Ai , ■ ■ ■ A ik )= p k , (3.4) 式变成 


或等价地 


£ [©]= 


I ： y-(iv 


E [ X(X - 1) • • • (X - fc + 1)] = n(n - 1) • • • (n - A + l) P fc 
利用上式可以递推得到各阶矩 E [ X k ), k ^3. 例如 ， k = 3 的情况下， 


E [ X(X - l )( X -2)]= n ( n - l )( n - 2) p 3 


或 

从而 


E [ X 3 - 3 X a + 2 X ] = n(n - l)(n - 2) p 3 


E[X 3 } = 3E[X 2 ] - 2E[X) + n(n - l)(n - 2) p 3 

= 3 n(n - l ) p 2 + np + n(n — l)(n - 2) p 3 ■ 

例 3 b (超几何随机变量的矩）设一个坛子中有 iV 个球，其中 m 个为白球， 
AT - m 个黑球.现从中随机地抽取 n 个球，此时 n 个球中的白球个数 X 就是事件 
山，也 ，…， A 的发生数，其中事件人表示取出的第 i 个球为白球.由于第 i 个球 
可以是 iV 个球中的任意一个,其中 m 个为白球，因此 P ( Ai ) = m / N . 由公式 (3.1) 
得到 E [ X } = H=i P (^ i ) = 观队 又由于 

P(AiAj) = P(Ai)P(Aj\Ai) = ^ - 二 _; 


再利用 （3.2) 式得 
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或 

或 


P ， r/X\1 ^ m(m - 1) / n \ m(m - 1) 

L 、2 刈 ~ ^. N ( N -1) — V 2>/ N(N - 1) 


E \ X(X - 1)] = n(n - 1). 


m(m — 1) 
N(N - 1) 


E [ X 2 ] = n(n - 1) 


m(m — 1) 
N(N - 1) 


+ E [ X ] 


进一步可得 


Var ( X ) = E [ X 2 ] - ( E ( X ]) 2 = n(n - + ; _ 


n 2 m 2 

~W~ 


mn f(n — l)(m - 1). 
~ W [ N -l 


7 \ 


这个结果与第 4 章例 8 j 所得的结果是相同的. 
利用 （3.4) 式，可得到 X 的高阶矩•由 


P(A ix Ai 3 ■ ■ ■ A ik ) = 


m(m — 1)■ (m - fc + 1) 
N ( N - k + l ) 


再利用 （3.4) 式，得 


pr / XX ! _ ( n \ m ( m - l ) - ( m-fc + l ) 
[\k)\ ~ \kJ ' N(N -1) -(N -k + 1) 


或 

_ 1). - iX - k + l)]=n(n-l )-- ( n-k + 1) >;“...(尺_闷 ■ 

例 3c (配对问题中的矩）设有 W 个人，随机地拿 帽子. 记耒为第 i 个人拿 
到自己的帽子.此时 

P(AiAj) = P{Ai)P{Aj\Ai) = - 

其中，表示第 i 个人己经拿到自己的帽子的条件下，第 j 个人拿到自己帽 
子的概率.这个概率与第 i 个人拿到自己帽子的概率相似，只是可选择帽子总数为 
AT - 1. 记X为7!个人中拿到自己帽子的人数，由公式 （3.2) 得到 

五 [(f)] = 石 寧 1 _ 1) = (^) N ( N - T ) 

从而， E [ X(X - 1)] = 1,也即， E [ X 2 } = 1 + .由于 = E.^1 P ( Ai ) = 1，我 
们得到 

Var(X) = E [ X 2 ] - (B[X]) 2 = 1 

这样，X的期望和方差均为1 • 对于髙阶矩,可利用 （3.4) 式，由于 P { A ix Ai , ■■■ A ik ) = 
l /[ N{N - 1) • • • (iV — fc + 1)]，可得 
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或 




N ( N - 1 )- -(N ~ k + 1 ) 


E [ X{X 一 1 ) …(X - ib + l)j = 1 


例 3 d (另一 个优惠券收集问题）设有 iV 种不同的优惠券，每次收集到的新优 
惠券均与以前收集到的优惠券相互独立.假定得到优惠券 i 的概率为 Pi , E^!Pi = 
1. 找出当收集到 n 张优惠券时，不同类型优惠券的类别数的期望与方差. 

解： 我们发现讨论未收集到的优惠券类别更方便.令 y 为己收集到的类别数， 
x = AT - y 为未收集到的类别数，记次表示收集到的 n 张优惠券中没有类别 i 这 
—事件，因此, X 是七，…中发生的事件数,每次收集到 i 以外的优惠券的概 
率为 1 - Pi . 因此, P ( Ai ) = ( l - Pi ) n . 从而 E [ X ) = E ,^ x ( l - P 0 n . 我们得到 

N 

E [ Y ] = N - E \ X ) = AT -5^(1- Pi ) n 

<=i 

类地,在收集优惠券时，既没有 i , 又没有 j 的概率为 1 - Pi - Pj . 同时,每次收集 
的优惠券种类与以前所收集到的优惠券相互独立，因此 


Pi^iAj) = (1 -p< - Pj ) n ， i^j 

这样， 

E[X(X -1)] = 253 P ( 人 A) = 2 53(1- Pi - Pi ) n 
*<j i<j 

或 E[X 2 } = 2^(1-Pi-Pjr + ElX) 

这样，我们得到 

Var(y) = Var(X) = E[X 2 ) - (£[X]) 2 

N N 2 

= 2 x ； (i — Pi — Pj r+^(i- P i) n -(X)(! - Pi) n ) 

i<j »=1 i=l 

特别，当 P< = l / JV，i = l ,2，，" ,iV 时， 

£ ( y ] = iv [ i -( i - l ) n ] 

Var(y) = N{N - l)(l - + ^(l - ^)" -N^(l- 士广 ■ 

例 3e (负超几何分布随机变量） 负超几何分布 (negative hypergeometric distri¬ 
bution) 是这样定 义的： 设一坛子内共有 m + n 个球,其中 n 个为特别的球， m 个 
为通常的球，每次从坛子中随机地取出一个球，即坛子中的每一个球都以相等的概 
率被取到.记 y 为取到 r 个特别球的 时候所 需的抽取次数，则 F 的分布就是负 
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超几何分布.负超几何分布与超几何分布的关系同负二项分布与二项分布的关系 
是一样的.它们不是考虑成功次数的概率，而是考虑为达到固定成功次数所需试验 
次数的分布.现在求 y 的分布 . Y = k 是这样的事件，它是由下列两个条件所确 
定的： 


( a ) 前面 fc - 1个球中，含 r - 1个特殊的球， k - r 个通常的球. 

( b ) 第 fc 个球为特殊球. 

显然， 


P{Y = fc } 


(r-dL-r) 

(1 + -T) 



n + m — fc + 1 


我们不打算用 y 的分布直接计算 y 的方差和期望.我们采用如下的技 巧：将 m 
个通常的球记成 0 l , ，用人表示“在 r 个特殊的球被取走以前, 0< 已经被取 
走”这一事件，令 X 为 • • • , 中事件的发生数，则 X 就是 r 个特殊的球被取 
走时被取走的通常球的个数.显然 y = f + X ， 因此， 

E[Y] =r + E[X\ =r + 53 p ( A i) 

i=l 

为计算 P (^), 考虑 n + 1 个球,其中一个球为％其他的球都是特殊的球.设想从 
坛子里一个一个地往外随机地取球，最后把全部球都取出来.现在可产生 n + 1种 
情况，一种情况是比这 n 个特殊球早出来，第2种情况是最先取到一个特殊球， 
然后出现然后其他球陆续出来，等等，最后一种情况是所有 n 个特殊球都取出 
以后， 0 i 才被取出来. 

由于这 n + 1个球都处于平等的地位，上述的 n + 1种情况是等可能的，因此， 
每种情况出现的概率为 1/ n ， 而烏刚好是由前 r 种情况所组成，因此 

这样 _ ^ r( n + m + l) 

£[y] = r + m . _ = 

举例来说，在翻牌游戏中，在一副扑克牌中，翻出一张黑桃所需的平均翻牌数 
为 1 + 39/14 = 3.786(r = l,n = 13, m = 39), 而翻出一张 “A” 所需的平均张数为 
1 + 48/5 = 10.6(r = l,n = 4,m = 48). 

现在计算 Var ( y ) = Var ( X ). 我们利用等式 

E [ X ( X - l )]^ 2 ^ 2 P ( A i A j ) 

i<j 

其中 P (人 木） 是 r 个特殊球被取出以前 Oi , Oj 已经被取出来的 概率. 考虑 n + 2 个 
球，其中包括 Oi , 0 j 以及 n 个特殊 的球. 由于 0 i , 0 j 以及 n 个特殊的球在抽取过程 
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中完全处于平等地位，因此事件 AiAj 等价于 0i 和巧 这两个球在被取出的过程中 
排在前 r + 1 位,这样， 

从而， 

或 

职 , 卜 + + 網 

由于 E [ X ] = mr/(n + 1), 我们有 

琴)=轉)=+- . 為-(5) 2 

—. mr(n +1 - r)(n + m + 1) 

(n + l) 2 (n + 2) 

例 3 f (优惠券收集中落单种类问题）设一共有 n 种不同的优惠券，在收集优 
惠券时，假设各种优惠券是等可能出现的，并且与以前收集的历史是相互独立的. 
现设一个人不断收集优惠券，直到全部 n 种优惠券收集齐全 为止. 现在希望求出在 
收集过程中，落单的优惠券的种类数的期望和方差 .® 

供••记 X 表示在收集过程中落单的优惠券数目.令7；表示收集到的第 i 种优 
惠券的种类 ® 用人 表示 T t 在收集的过程中落单这一事件，则 A ■等于山…， 
中发生的事件数，从而 E [ X ] = E ?=, P ( Ai ). 

现在求 P ( Ai ). 当第一次收集到7；类型的优惠券后还需收集 （n - i ) 种新的 
类型的优惠券®此时，这 n _ i + l 种 （ n - i 种未收集的以及乃）优惠券同等可能 

① 一种 优惠券称为落单的，是柑当收集到全部种类的优惠券时，这种优惠券只收集到一张.——译者注 

② 例如，第一次收集到的优惠券的种类称为: n , 因为它是收集到的第1种优惠券. 若第二 次收集到的不 
是乃类型，则称为类型 t 2 , 因为它是第2种优惠券.因此，收集到的优惠券序列总是乃， 
T1T2T3T1 ■ ■ ■. —译者注 

③ 现在看第一次收集到以后的优惠券收集情况.我们只关心这 n — i +1 种优惠券出现的情况，其中 

n _ i 种是以前没有收集到的优惠券，还有一种就是乃.我们将这 n - i +1 种优惠券在收集中出现 
的順序分成两类.一种情况是在最后出现，这种序列是这 样的： Ti . - IVi , • ■ W Jn _ i 

... T 4 , 这个序列的第一个总是表示在《个收集过程中第-•次收集到第 i 种优惠 券乃， 后面的 
W h 表示出现了 -个新的优惠券种类.此后出现的种类依次为不过除了第一个为7；外， 
在以前没有第二个 r *. 这个序列实际上到 Wj „_ 4 就终止了，因为 c 经收集到全套优惠券 
了，因 ji , 1 出现这种情况 T , 就落单了.另外一种情况为…而诸 W 
之前除了第一个7；以外，还有一个 I ；,此时，7；就不落单.（此处 ji , - jn - i 为1 ,… n - i 的一 
个排列 .） 这样看乃是不是落单，就看在第一次出现 7 i 以后，这 n - i + 1种优惠券哪--种最后出 
现，若最后出现， T * 就落单.若这 ( n - i ) 种新的优惠券中的某一种最后出现，乃就不落单. 

—译者注 
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地能成为最后一类被收集到的优惠券.显然 I ；落单的概率为 l/( n -t + l ), 因此 
P ⑷ = l /( n-i + l ), 从而 

寧】=叾丄 屯 

现在确定落单优惠券数的 方差. 对 i < j , 定义表示“第一次收集到乃时 ， D 
仍只有一张”，显然 AiAj C Sij , 

P ( AiAj ) = Pi ^ AjIS ^ PiSij ) 

P ( Sij ) 是如下事件的 概率： 收集到 刃后 ，在 T ； 和待收集的„ - i 种共„ +1 - i 种 
优惠券中，收集的前：/ - i 种中没有 7；. 由于 I ；等可能地成为第一、第二、……、 
第 n + 1 _ i 种再次被收集到的品种，因此 

P( 5<J .) = 1 __lz^ = !i±ll4 

n — * + 1 n+1 — 丨 

现在考虑发生的条件下，发生的概率.当第一次收集到乃以后 （ li 在此 
前已经收集到)，考虑以后的 n_j + 2 种优惠券，其中包括尚未收集到的 n - j 种 
新的优惠券以及和乃，只有 T it Tj 出现在 n - j 种未收集到的优惠券之后,亊件 
AiAj 才发生.由于这 n-j + 2 种优惠券的地位是平等的，这样 

PM 為咏) = l/( n + 2 _J ) = ( n -j + 2)( n-j + l ) 

由此可得 

^i)=( n - J + 2 ) 2 (n-i + l) i<j 

因此 

职义令 如以 “㈠ ） 

利用前面得到的 B [ X ) 的公式，有 

v„m=4g (n+1 _. ) 1 (n+2 _. )+ | ： i-(| ： i) s ■ 

7.4 协方差、和的方差及相关系数 

下面是关于独立随机变童乘积的期望的一个命题. 
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命题 4.1 若尤， F 相互独立，则对任何函数 h 和丨下式 成立: 

吨 ( x )/ i ( y )】 = _%( x )】 E [ My)l 


证明： 设 x ， y 具有联合密度 / Oc , v ), 则 

E(fl(X)h(y )] =厂厂 g{x)h(y)f(x,y)dxdy 

= f f 9 {x)h{y)fx(x)f Y (y)dxdy 
J—oo J —oo 

= f h(y)f Y (y、dy f g{x)fx(x)<ix 
J —oo J —oo 

= 聊寧[5⑽ 


离散情形下的证明是完全类似的. 口 

期望和方差可以给出单个随机变量的信息，两个随机变量的协方差可指示两个 
随机变量之间的关系. 

定义 a •和 y 之间的协方差 Cov ( x , y ) 由下式给出: 

Cov ( x , y ) = e [( x - g [ xi)(y - g [ y ]))_ 

将上式右边期望号下的表达式展开，可得 

Cov ( X , y ) = E [ XY - E [ X]Y - XE [ Y ] + £[ X ] f ；[ y ]] 

= E [ XY ]~ E [ X ) E \ Y ) - E [ X ) E [ Y ) + E [ X ) E [ Y ] 

= E [ XY ]~ E [ X ] E [ Y ] 


若 X , Y 相互独立，则由命题 4.1 可知 Cov ( X , y ) = 0. 但是其逆命题却不真_ 
下面给出一个相依随机变量具有零协方差的例子•设久满足 下式： 

P{X = 0} = P{X = 1} = P{X = -1} = 1/3 

定义 



由 AT 三 0 可知 E [ XY ) = 0,同时 E [ X ] = 0,从而 

Ck > v ( X , y ) = E [ XY ]~ E [ X ] E \ Y ] = 0 


然而， X , Y 并不独立. 

下面的命题列出了协方差的若干性质. 
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命题 4.2 (!) Cov ( X , Y ) = Cov ( Y , X ) (ii) Cov { X , X ) = Var(X) 

(iii) Cov(aX,y) = aCov(X,y) 

(iv) Cov( 不， = E? = i E, m =i Gov (不， A) _ 

命题 4 . 2 的 证明： (i)(ii) 可直接由协方差的定义证得 .（iii) 作为练习留给读者 
去证. 现证结论 （iv ). 记= E [ Xi],Vj = E \ Yj ]. 则由 

得 t»l isl J=1 J=»l 

/ n m \ r w n m m i 

Cov (E^E^j = £ [(E^-E^)(E y i-E^)] 

= E \ j 2 ( X i -^)' Z ( Y i - Vj )\ 

L i=l j=l J 

L *=1 >-l J <=1 i=l 

上述最后一个等式也是利用了期望运算的可加性. 口 

利用命题 4.2 的⑻和 （iv)， 并且取& = A, j = 1,…， n, 可得 

Var (亡 &) =Cov (亡不，亡4)=亡亡 

»=1 «=1 i=l i=l j=l 

=E Var(X 4 ) + 53E Cw (足，⑹ 


在上式中，对于二重和中出现了两次，因此上式等价于 


如果 A ，- 
化为： 


E X *) = E Var ( x *)+ 2 EE 心 ( 不， ^ 

、 i=l / i=l i<j 

:, 即对于 i/j, 不与 & 相互 

Var (E^) = ^ Var(Xi) 

、 i=l / *=1 


Var I > ; I = > ，(不)+ 2> ,> ,Cov(Ui) (4.1) 

, X n 两两独立，即对于 Xj 相互独立.此时，方程 （4.1) 简 


下面的例子说明了公式 (4.1) 的用处. 

例 4a 设X:，…，为独立同分布随机变童序列，其公共期望为 M, 方差为 
cr 2 . 如例 2c 那样，令X = E?=i XJn 为样本均值， - X, i = 1, …， n 称为离差， 
等于个体数据与样本均值之差.随机变量 

r.2 ^ — -^) 2 
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称为样本方差.求⑷ Var ⑺和 ( bJ ^ lS 2 ]. 

解： （ a ) 利用独立性得 

Var(X) = 0(i ： 不 )= 0 2 EVar(X 4 ) 


(b ) 我们由下列代数恒等式开始计算 
(n-l)S 2 = Y i (Xi-^ + n-X) 2 

i=l 

— - n) 2 + 52( 尤 - m) 2 - 2(x - n) - 只 ) 

i=l t=l i=l 

= Y,(Xi - /i) 2 + n(X - n) 2 - 2(X - li)n(X-ix) 
i=l 

= f 2( Xi - n ) 2 ~ n ( X -^ 

«=i 

再求期望，得到 

(n - l)E[5 a ] = E[( 足 - M ) 2 卜 n£[(X- M ) 2 l 


= ncr 2 — nVar ( X ) = (n — l ) a 2 

上面的最后等式是利用了 （ a ) 的结果，而最前面的等式是利用例 2 c (即 m = E [ X \) 
的 结果. 两边再除以 （n - 1) 就得到样本方差的期望为 ■ 
下面例子提供了求二项随机变量方差的另—个方法. 

例 4 b (二项随机变童的方差） 设； f 为二项随机变童，其参数为 （ n ， p ), 求 


Var ( X ). 


解： 由于 A ■表示 n 次独立重复试验的成功次数，而每次成功的概率为 P ， X 可 
表 示成 ： X = & +…+ ，其中不为独立同分布的伯努利随机变量 


fl 第 i 次试验成功 
其他 


利用 (4.1) 可得 Var ( X ) = Var ^) + ••• + Var ( X „). 又有， 


Var ( X i ) = E [ X ?] -(五[不]) 2 = E 岡-(五闷) 2 由于< =不 

= P-P 2 


因此, Var ( X ) = np(l - p ) _ 

例 4 c (有限总体中的抽样）设一共有 AT 个人,每一个人对某件事情有一个态 
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度,用一个实数《表示一个人对该事件的“支持态度” .用叫 表示第 i 个人的支持 
态度 ， i = 1,2, ••- , N . 

现假定一个统计工作者为了获得关于巧的信息，他“随机地选定” n 个人，了 
解他们的 t ； 值.所 谓随机地选定 n 个人，是 指所有 n 个人的组都是等可能地被选 
定，而这种组一共有个.当这 n 个人被选定之后，就征询他们对某事件的态 
度并确定他们的 t ； 值.用 S 表示这些被选定的 n 个人的值的总和，求它的期望 
和方差. 

上面提到的问题的一个重要的特例是，在未来的选举中，某社区中的每个人对 
于某项建议或者候选人有一态度，或者支持或者反对，若取％为1表示第 i 个人支 
持，取0为反对，则 S 表示社区中表示支持的人数 比例. 为了估计0， 

取一个 n 个人的随机样本,让他们进行投票表态,样本中表示支持的人数所占的比 
例 S / n , 通常用作 S 的估计. 

解：对每一个人 i,i = l ,-.., N , 确定一个示性函数 A ， 表示这个人是否在样 
本中， 



S 具有下列表达式 


5 = 


故 


由于 

可得 


N 

E [ S ] = 

i=l 

N 

Var(5) = y^Var(t ； i/i) + 2 W Cov { yiIi , VjIj ) 

t=l i<j 

= u ? Var ⑹ + 2 mi ViVjCoviliJj) 

i=l i<j 


邮 l = i 


E [ lili ) 


n(n — 1) 
N {N - 1) 


Var(7 i ) = ^(l-^) 

。 略 4) = N ^ N - l ) _ ~ NHN ^1) 
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因此， 

v — = - I^EE 叫 

*=1 v ' \<i 

利用恒等式 (t, 1+ ... + WAf )2 = ^ =1 v ? + 2 ZEi < j ^ Var(5) 可简化为 

N 


Var(5) : 


n(N — n )( 
'' N-l 


N 


- v 2 


现在考虑 Np 个叫为1， 其余的％值为0的特殊情况.此时, S 是一个超几何随机 
变量，其期望和方差为 

£[S] = nv = np 由于 u = # = p 

邱 )= 鮮 ( 眢- 小鮮 p(1 _ p) 

S / n 表示样本中叫取值为1的那-部分的比例 .S/n 的方差和期望 如下： 


? [ f ] =p ’ Var (!)=^ i ) p(i - p) 


(4.2) 


设为两个随机变量,假定 Var(；0 和 Var(y) 均大于0,则 
N /Var(X)Var(y) 

称为；1：和 y 的相关系數,可以证明 

-1 彡 p(X,y ) 彡 1 

为证明 （4.2) 式,令 ( t | = Var(X),4 = Var(K). 利用不等式 

0<Var (X + n = YarW + VaraO + + 】 

OyJ a x ( T v 

可知 -i 另一方面，由不等式 

0^Var(^-^) = ^ + ^-HMl=2 l l-p(X,y)] 

可知 p { X , Y ) < 1. 因此，不等式 (4.2) 成立_ 

事实上，由 Var(Z) = 0可推知随机变量 Z 以概率为1地等于一个常数（第8 
章将严格地证明这一事实).由 （4.2) 式的证明可以看出，若 p ( X , Y ) = l , 可推导得 
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y = a + &X， 其中 & = a y / a x > 0,同理，若 p { X , Y ) = -\, 可推导得 Y = a + bX ,% 
中6 = - a y / c x < 0. 现在我们将下列逆命題作为练习留给 读者： 若 y = a + 6A ■，则 
p ( X , Y ) = +1或 - 1，其正负号由 b 的正负所决定 ■ 

相关系数是 x , y 之间线性依赖程度的一种度量.当 P ( X , y ) 接近+1或 -1 时， 
表明 A •与 y 之间具有很高的线性依赖性，而当 p ( x , y ) 接近0时，表示两者之间缺 
乏这种线性依赖性•当 p ( x , y ) 取正值时，说明当 x 增加时， y 趋于增加，而负值说 
明当 X 增加时， y 趋于下降 •若 p ( X , Y ) = 0, 则称 X , Y 为 不相关 ( uncorrelated ). 
例 4 d 记 I A , I B 为事件的示性函数，即 

1 B 发生 
0其他 

E [ I a ] = P ( A ), E [ I b ] = P { B ), E [ I a Ib ) = P { AB ) 

故 

Cov { I A , I B ) = P { AB ) - P ( A ) P ( B ) = P ( B )[ P ( A \ B ) - P ( A )] 

由上式可得到一个非常直观的结论：以和 M 为正相关，不相关或负相关，只需看 
P ( A \ B ) 是大于、等于或小于 P ( A ) 即可. ■ 

下面的例子指出样本均值与离差是不相关的 • 

例 4 e 设 Xi ，…，为独立同分布序列，其公共方差为 <7 2 ,指出 
Cov(Xi-X.X) = 0 


4发生 
其他 


Cov(Xi -X,X) = Cov(Xi， 又)- Cov(X, X) = Cov I X*, - ^ Xj I - Var(X) 


a 2 a 2 (t 2 


' = ^ Co,(x, ' x,)_ " ： 

其中第三个等式是利用了例 4 a 的结果，最后的等式是由于下列等式的结果， 


Cov (足， &)= 


t 




由独立性 
由 Var(Xi) = (7 2 


尽管X与 X* - X不相关，但通常它们并不相互 独立. 然而当 X* 为正态分布 
时，X不仅与 Xi-X 独立，而且与整个序列 X j -X,j = l,2 ,--,n 相互独立，这 
些结果将在 7.8 节给出.在 7.8 节中还将指出在正态的假定之下，尤与样本方差5 2 
也相互独立，并且 （n - 1)S 2 /< t 2 具有自由度为 （n _ 1) 的X 2 分布（关于 S 2 之定义 
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见例 4 a ). ■ 

例 4 f 考虑 m 个独立实验，每个实验具有 r 个可能的实验结果，相应出现的 
概率分别为 Pi ,- - = 1- 令况表示 m 次实验中结果 i 出现的次数， 

则 M ，…， M •具有多项分布 


P{M :" 1 '的 = 叫’队 = 〜 } =， 



对于 i # j •，当 况增大时，■^应趋向于变小，因此，直观地看来 ，风与 ％应为负 
相关. 现在计算它们的协方差 • 况和具有下列表达式 


风 =5> (fc) 和 ^ = E 7 i (*) 


其中 


/(fc)= fl 第 fc 次试验的结果为 i 7 f 1第 fc 次试验的结果为 j 

V )其他 iU = jo 其他 

利用命题 4 .2( iv ) ,得到 CoviN ^ Nj ) = Er=x Cov (八 ( fc ), 心⑷).由于第 fc 次试 

验结果是与第《次试验结果是相互独立的，可知 


另一方面, 


Ck > y (/ i ( k ),/ j (£)) = 0 k^e 


Covim,^)) = Eil^Ijit)] - E [/ ,(/)]£；[/, (^)] = 0-^ = -PiPj 
这样,我们得到 

Cov ( iV 4 , Nj) = -mPiPj ijtj 
由上式可 知况和 AT , 是负相关的，符合我们的直观看法. 


7.5 条件期望 


7.5.1 定义 

当 X 和 F 的联合分布为离散分布时，对于 W > 0的！ /值 ，给定 F = I / 
之下， X 的条件分布列由下式 定义： 

Px\y(x\v) = p {X = x\Y = y} = ;(:::)) 

很自然地，对于 priy) >0,X 在给定 Y = y 之下的条件期望由下式给出 
E[X\Y - y] = ^xP{X = x\Y = y} = ^xp x[Y (x\y) 
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例 5 a 设 X 和 y 独立同分布，其公共分布为二项分布，其参数为 （ n ， p ). 计 
算在 X + F = m 的条件下 A ： 的条件期望. 

解： 首先计算 X+Y = m 之下, X 的条件分布列，对于 fc < min ( n , m ), 

P{X = k,X + Y = m} 


P{X = k\X + Y = m} = 
_ P{X = k,Y = m — k} 


P{X + Y = m} 

P{X = k}P{Y = m-k} 


" P{X + Y = m} ~ P{X + y = m } 

->■) 一 （U 




C) 


此处,我们利用了 X+Y 的分布列为二项分布 I 参数为 (2 n , p )]. 因此，在 X+y = m 
的条件下，久的分布为超几何分布.由例 2 g , 我们得到 

E[X\X + y = m ] = m /2 ■ 

类似地，设 A ■和 y 的联合分布连续，其联合密度函数为 f(x,y), 对于给定的 
V = y , 只要 fv(y) >0,X 的条件密度函数由下式 给出： 

/寧 ㈣ ) = 德 

很自然地，给定 F = i /的条件下， A ■的条件期望由下式给出 
E[X\Y = y] = J xfx iY {x\y)dx 

此处假定 fy(v) > 0. 

例 5 b 设 A ■和 K 的联合密度函数为 
e -*/» e -» 


f(x,y) - 

计算 E[X\Y = y]. 

解： 先计算条件密度 

_ f(x,y) _ 


0< i < oo , 0< j / <oo 


fx\Y(x\y )= 


f(x,y) 

f{x,y)dx 


(l/y)e- J /Ve-» 

{l/y)e- x/v e~ v dx 


(l/v)e 


/ (l/y)e~ x ^dx V 
Jo 

因此， A ： 在给定 Y = y 之下的条件分布刚好是指数分布，其期望为 y , 因此 


E[X\Y = y] = 


—e~ x ^ v dx = 


注释条件概率满足概率的所有性质，条件期望也满足通常期望的性质，例如 
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公式 


E\g(X)\Y = y] 


J 9(x)fx\y{x\y)dx 


离散情形 
连续情形 


E[f2Xi\Y = y]=Y,E[X i \Y = y} 

i=l i=l 

仍然有效.事实上，给定 K = 1/之下的条件期望可以看成是较小的样本空间中的普 
通的期望，这个小的样本空间由满足条件 {y =以的那些样本点组成. ■ 


7.5.2 利用条件计算期望 


用 E[X\Y] 表示随机变量 Y 的函数，它在 y = y 处的值为 E[X\Y = y ], 注意 
E[X\Y\ 本身是一个随机变釐.下面给出的命题是条件期望一个极其重要的性质. 


命题 5.1 



_ 

E[X] = E[E[X\Y)] 

(5.1) 


若 y 是离散型随机变董， （5.1) 变成 


E [ X ] = 53 E \ X\Y = y ] P{Y = y } (5.1 a ) 

v 

若 y 的分布连续，具有密度函数 / y ( y ), 则 (5.1) 式变成 

E [ X ) = J^° E [ X\Y = y \ f Y ( y)dy (5.1 b ) 

A ： 和 y 为离散情形下 （5.1) 式的 证明： 我们必须指出 

E [ X ] = Y , E [ X \ Y = V] p { y = V } (5-2) 

从等式右边开始， 

E E [ X\Y = y ] P{Y = = xP ^ X = = 刺 y W 

v w * 

义 W 二「 v } p ^ y = y )-,, y = y ) 

=x P{X = x,y = y } = y ^, xP{X = x } = E [ X ] □ 

可以这样来解释 （5.2) 式，期望值 E [ X ) 可以看成条件期望 E [ X\Y = y ] 的加权 
平均,而权值刚好是条件 {Y = y } 的 概率. 这个结果对计算随机变量的期望是极其 
重要的，它可以让我们首先很容易地计算某随机变量在给定条件之下的条件期望， 
然后再对条件期望求平均.下面的例子说明了这个公式的 用处. 
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例 5 c —个矿工在井下迷了路，迷路的地方有三个门，从第一个门出来，经过 
3个小时后，可到达安全之处.若从第二个门出去，经过5个小时后，他会回到原 
地.若从第三个门出来，经过7个小时后才会到原地.假定工人在任何时候都是随 
机地选择一个门.问这个工人为了走到安全之处，平均需要多少时间. 

解：设 X 表示该矿工为到达安全之处所需的时间，又设 y 为他选择的门的号 
码，则 

e \ x ] =£[ x | y = i ] p { y = i }+£：[ x | y =2] p { r =2}+£；[ x | r =3] p { y =3} 

= i ( E [ X|y = 1] + E[X\Y = 2]-+ E[X\Y = 3]), 

然而 

E[X\Y = 1] = 3 E[X\Y = 2] = 5 + E[X] f ；[ X|F = 3 j = 7 + (5.3) 

我们在此对 （5.3) 式作一解释，例如 E[X\Y = 2] 的公式，其理由 如下： 如选择 
第二个门，他花5个小时后又回到了原地,但回到原地，问题与刚开始时一样，他到 
达安全地点所需时间为 E[X]. 因此 E[X\Y = 2] = 5 + £[ X ]. (5.3) 的其余公式是完 
全类似的.因此 

E[X] = |( 3 + 5 + E i X ] + 7 + £ 1叉1) 

从而 E[X) = 15. ■ 

例 5 d (随机个数随机变量之和的期望）假设在某一天进入百货商店的人数是 
一个随机变量，其平均数为 50. 进一步假定这些顾客在店里花费的钱数是相互独 
立且同分布的随机变量，每位顾客的花钱数的期望为8元，并且顾客的花钱数与进 
入百货店的人数也是相互独 立的. 求那一天百货店营业额的期望值. 

解：记 JV 为进入百货店的顾客人数，是顾客 i 在店内的消费额，则百货店 
内消费总量为 Ei=iXi 

i=l i=l 

但 

N n 

L »=i i=i 

= B [亡不]由 Xi 与 TV 的独立性 

»=i 

= n £[ X ] 其中 E[X} = E[Xi] 

由此可得， r W 1 

E E 足叫 = NE[X\ 
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从而 

N 

£[5^ Xi ] = E [^ T £；[ A -]] = £；[7 V ] S [ X ] 

L «=i 

因此，当天百货店营业额的期望值为50 x 8 = 400元. ■ 

例 5 e 掷骰子的 “ Crap ” 游戏是这样的，每次掷两枚敢子，开始时，如果得到 
的点数之和是2, 3或12则玩者输，若得到7或11，则玩者贏，若得到的是其他点 
数 i , 则需继续玩下去，一直到掷出7或 i 为止.若玩者最后得到的点数为7,则玩 
者输，若最后得到的为 i 则玩者贏.记 ii 为掷般子的次数 ，求： 

(a) £[«]; ( b ) 丑问玩者贏 j ; ( c ) 珂/?|玩者输 
解 ：记巧 为每次掷敢子得到两个骰子之和为 i 之概率，易知 
Pi = Pu-i = i = 2,3, • _ • ，7 

记 S 为第一次掷出点数，则 

12 

其中， 

E[R\S = t] 

在上式中，若第一次得到 i，i / 2,3,7,11或12,则玩游戏者必须继续进行直到 
出现 i 或7为止,而掷般子的次数服从几何分布，参 数为巧 +朽.因此,掷敢子的 
期望次数为+ 1 ,其中+1表示加上第一次掷骰子，这样， 

ri + ri 

6 P 10 P 

E [ R \ = 1 + E + E p - fp ； = 1 + W + 4/10 + 5/11) = 3.376 

现在计算£：[/?|贏1 ,为此，先计算玩游戏者贏的概率 P . 将第一次掷骰子的结果 S 
作为条件， 

上面等式中当 S = i,i = 4,5,6或8,9,10时,尸{贏15 = i } 就是在后续掷骰子过程中， 
i 在7 之前出现的概率，值为 Pi/iPi + P ,)- 现在需要确定玩游戏者贏的条件下5 
的条件概率,记弘=尸卩=〗|贏}，我们有 

Q 2 = Q 3 = Ql 2 = 0 Qt = Pi/p Qll = Pll/p 
对于 i = 4,5,6,8,9, 10 

P{S = i , m ] PjP { E|S = i } i ? 

W， ~ P{K} ' P ~p(Pi + Pr) 


t = 2,3,7,11,12 
其他 



这样， 
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五[叫豪1=^>[丑 I 鼠 5 = i ] 弘 

在第6章例 2 j 已经指出，已知 S = i 的条件之下，需要掷多少次骰子与最后的结果 
是贏或输是相互独立的 .( 可以这样来看这个事实，在需要掷的次数为 A 的条件下， 
是贏是输的概率与已经掷了几次是无关的，再利用事件独立性的对称特性，即乂独 
立于事件 S ， 则 B 也独立于事件>1,可以推出在输贏己知的条件下， R 的分布与输 
贏也是无关的 .） 这样我们得到 

£；_ =乙五[聊= 抑 = i + |： fi%; + E ^ r ^ = 2 - 938 
虽然我们可以仿照计算 E [ R \ M ] 一样，计算利州 输]. 但是由下面的公式 
£[/?] = £[ fliii ] p + E [ R \ m ]( i - p ) 

可立即求得 

E[Rm = 綱；?广贏运 = 3.801 ■ 


例 5 f 在第6章例 5 c 已经指出，二维正态随机向量 ( X , Y ) 的联合密度为 


f ( x , y ) = 


2 na x a y ^\ — p 2 


__ ( y-^v 

2(1 - P 2 ) L V ^ \ Oy 


(g - fix)(y - Mv)ll 

J J 


现在需要指出 p 是 X 与 y 的相关系数.第 6 章例 5 c 己经指出，在 Y = !/之 
下, x 具有正态分布，其条件期望为 A + P ^( y - Mv ). 由此得到 
E [ XY\Y = 1 /] = E [ Xy\Y = y ] = yE [ X\Y = y ] 

= j/[m* + P^(y - A*v)] = WMi + P~(j / 2 " fh/y) 


从而 


E [ XY \ Y ] = Yn x + p —( Y 2 - n v Y ) 
a v 


由上式可得 

E[XY] = e\^h x + py{Y 2 - HyY)] = HxE[Y] + P ^ E [ y2 - ^v Y \ 

— Hxlly + p^-(E\Y 2 \ - My) = MxMv + P~ Var ( y ) = M*Mv + POxOy 
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由此可得 


Corr ( X . y ) : 


Cov ( X , Y) 


E[XY ] - 


_ P ^ z ^ l / _ 
Ox a y 


有时候，随机变量 A： 的期望 E [ X ) 反而容易计算,此时我们可利用关于条件期 
望的恒等式（即 （5.1a) 或 (5.1b)) 来计算条件期望，请看下面的例子. 

例 5g 考虑 n 次独立重复试验，每次试验的结果为 , k , 相应的概率为 
Pi, -- ,Pfc，E,-=iPi = 1.令况表示试验中出现结果 i 的次数.对于 i #么计算 
(a) 卿 iV< > 0]. (b) EiNjlNi > 1]. 

解： 对于 (a), 令 

7={°' ^ = ° 
ll, Ni>0 

E [ Nj ] 可以写成 

E[A0] = E [ Nj\I = 0]P {/ = 0} + £[^|/= 1 ] P{I = 1} 

或等价地 


E [ Nj ) = E [ Nj\Ni = 0\ P{Ni = 0} + E [ Nj\Ni > 0] P { AT < > 0} 

对于 iVi , 其无条件分布是二项分布，相应的参数为 ( n , Pi ). 现在设 N i = r 给 
定,则其余的 N - r 次试验不会取到 i , 并且相互独立地取 j 的概率为 P ( j | 不是 i ) = 
Pi /( l - Pi ). 因此 A / j 在 N i = r 之下的条件分布为二项分布,其参数为 ( n - r , Pi /( l - 
p <))( 关于推导的细节可参见第 6 章例 4 c ). 又由于 P{Ni = 0} = ( l - p <) n . 因此，上 
面关于 E [ Nj ] 的等式变成 

n Pj = " Y ^ rd - Pi )" + > 0](1 一 （1 一 Pi ) n ) 

上式给出 ， 、， 

1 _ n — Pi ) n_1 

g W ^>°1 = "Pi i - d - p ,)" 

对于 （ b), 其讨论是完全类似的，令 

{ 0 , Ni = 0 

1,风=1 
2,风>1 

得到 

E [ Nj ] = E [ Nj\J = 0} P{J = 0} + E [ Nj\J = 1] P { J =1} 

+ E [ Nj\J = 2] P { J = 2} 


或等价地 
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E[Nj] =E[Nj\Ni = 0]P{Ni = 0} + E[Nj\Ni = l]P{Ni = 1} 
+ E [ JV j |7 Vi > l ] P { JV i > l } 


由这个公式导出 

npj =r» i 巧卩 . (1 — Pi) n + (n — 1、 ^ J p ； n Pt(l — Pi) n 

+ B[Nj\Ni > 1](1 -(1- Pi ) n - n Pi (l - Pi ) n_l ) 


最后得到 


> 1 ]= 


np,[l - (1 - Pi )"- 1 - (n - 1) P< (1 - Pi ) n - 2 ] 
l -( l - p <) n - nPi ( l - Pi ) n_1 


类似地，也可以利用条件的方法计算随机变量的方差.请看下面的例子： 

例 5 h (几何分布的方差）设有一独立重复试验序列，每次试验成功的概率为 
P, 记 W 为取得第一次成功所需的试验次数.求 Var ( N ). 

解：令 y = 1,若第一次试验 成功 ； y = o , 其他 情况. 利用公式 
Var ( N ) = B [ iV 3 ] - ( E [7 V]) a 
为计算 E ^], 先将它写成如下形式 

E[N 2 } = E[E[N 2 \Y]\ 


由于 

f ； [AT 2 |y = 1] = 1 
£；(7 V 2 |y = 0) = E[(l + N) 2 ] 

上述两式成立的理由如下，若第一次实验成功，显然 W = 1,从而 W 2 = 1，故第一 
式 成立. 若 y = 0,即第一次试验失败，则在此种情况下试验相当于重新开始，因此 
为了达到第一次成功所需实验次数变成^ + ^我们得到第二式•这样 


e [ n 2 ] = e [ n 2 \y = ljptr = 1} + e [ n 2 \y = o]P{y = 0 } 

= p +( l - p ) 五 [(1 + N ) 2 ] = 1 + (1 - p)E[2N + N 2 } 


在第 4 章例 8 b 中，已经指出= 1/ p , 因此我们得到 

E[N 2 ] = 1 + 2(1 ~ p ) +( l - p ) E [ N 2 ] 


由上式解得 


e[n 2 ] = 2 -^- 


从而 


Var(iV) = £[N 2 ] - (E[^) 2 = ^ - ^ 
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例 Si 考虑有 r 个玩家的赌博问题，开始时玩家 i 具有叫个单位的赌资， 
> 0,1 = 1, -• • , r . 每一盘,选出两人进行赌博，胜者从败者拿走一个单位赌资，任 
何人,只要赌资变成0,就退出 比赛. 一直到某个人贏得所有赌资 n 三叫个单 
位. 这个人就是最后的贏家.假定各盘的输贏都是相互独立的.并且参加赌博的任 
何一对玩家，两人都有相同的贏的概率.求结束赌博所需盘数的期望. 

解： 首先,我们假定只有两个 玩家. 玩家1和玩家2的最初的赌资分别为 j 和 
n - j 个单位.记&为结束赌博所霈的盘数.记= E [ Xi ), 对于= 1 ,… ，n - 1， 

Xj = 1 + Aj 

其中表示第一盘以后所需的附加盘数.由此得到 
mj = 1 + E [ Aj \ 

以第一盘的结果为条件，可得 

m j = l + E [ Aj \\ K 第一盘] • $ + E [ Aj \2 贏第一盘卜 $ 

如果玩家1鼠此时玩家1的赌资变成 j + 1,而玩家2的赌资变成 n - j - 1,显然 
■ BAI 1 贏第一盘]= mj + j , B [ i 4 j |2 贏第一盘]= m . j-i 
这样，我们得到 

m j = 1 + 2 mj+l + 2 m,_1 
或 

m . j+i = 2 rrij - rrij-i - 2, j = 1,••- , n - 1 (5.4) 

利用 mo = 0,得 

m 2 = 2mi — 2 

m3 = 2i7i2 — mj — 2 = 3 mi — 6 = 3 (mi — 2) 
n»4 = 2m3 — m2 — 2 = 4 mj — 12 = 4 (mj — 3) 

由此，看出有如下规律， 

rrii = i ( m \ — t + 1), i = 1,2, ••- ,n (5.5) 

要证明上式，只需利用数学归纳法.我们已经证明对于 i = 1,2, (5.5) 式成立，假定 
(5.5) 式对一切 *< j < n 成立,利用 (5.4), 

THj+i = 2 rrij — rrij-i — 2 

= 2 j( mi + -j + 2)-2 (由归纳法假设） 

= 0' + l ) m ! - 2 j 2 + 2 j + j 2 -3 j + 2-2 
= {j + l)^»i - j 2 -j = {j + l)(mi - j ) 
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由归纳法，我们证明了 （5.5) 式,利用 m „ = 0,可得 
mi = n — 1 

再利用 （5.5) 式,可得 

rrii = i(n — t) 

这样，当只有两个玩家且初始赌资分别为 i 与 n - i 的时候，所玩的盘数的均值为 
i ( n - i ), 这个数也是玩家1玩的平均盘数. 

现在回到 r 个玩家参加赌博的游戏， r 个玩家每人开始时，手中的赌资为 n <, 
i = l , - , r , H = i 叫= n . 令 A ： 表示从赌博一开始到结束所赌的盘数. 令&为玩 
家 i 自始至终所赌的盘数.虽然，在 i 参加的各盘赌博中，其对手不 一. 由于各对手 
都是势均力敌.对于 i 来说,他的各盘赌博就像是 与一个 “人”赌似的，但这个人的 
赌资是 n - n <. 这样，第 i 人参赌的盘数的平均值为 E[Xi) = n <). 这 r 个人 

参赌的总盘数的平均值为 

E [亡 = ^rK(n-n<) = n 2 -^n? 

L<=i J »=i «=i 

但实际赌博时，都是两人参加一盘赌博.因此赌博从开始一直到结束的盘数 x = 
Uo 这样， r 

酬= 4 ( n2 -右 <) 

十分有意义的是，我们的论证显示，从开始到结束，赌博的平均盘数并不依赖于对 
手的选择.但是， A •的分布却是依赖于对手的 选择. 例如 ， r = 3, ru = n 2 = l , n 3 = 2. 
如果第一盘让赌徒1和赌徒2先赌.那么至少要赌3盘才能决出最后的胜者，即 
P{X > 3} = 1. 但是让赌徒3在第一盘中玩，那么就有可能在2盘之内决出最后 
的胜利者.即 P{X = 2} > 0. 这说明 X 的分布是依赖于对手的选 择的. ■ 

下面的例子中，我们利用条件期望的性质验证 6.3.1 节中的一个结果： （0 ,1) 上 
独立同分布均勻随机变量序列的部分和最早超过1的部分和项数的期望值竞然等 
于 e _ 

例 5 j 设 U lt U 2 , - 为一相互独立的 （0,1) 上均匀随机变量序列，求 E[N], 
其中 n 

N = min |n : Ui > l | 

i=l 

解： 我们将得到一个更一般的结果.对于 : r e [0,1】，令 
N(x) = min |ra : ^ Ui > x | 


及 


i(aO = E[N(x)} 
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N(x) 是部分和 Ui 超过 a ; 的最小指标 n , m (: c ) 是 N(x) 的期 望值. 将 R 作 
为条件，利用公式 (5.1 b ), 得到 


m ( x ) = [ = y]dy (5.6) 

•/o 

对于条件期望 S [ iV ( i )| t/i = y], 我们有 

E [ iV ( x )|^ 1 = 1 ,] = J 1, V>X (5.7) 

[1 + rn(x -y), y < x 

上式中，当 V > a : 的情况等式是很显然的，当 j / < a : 时，此时需要继续取 f / 2 ,... ，此 
时相当于序列从的开始,要求出超过; r - y 的最小时刻.因此，这个时刻的期望值 
应为 m ( a : _ J /) ，加上原有的 R 这个随机数，£[^( 1)|£/1 = y) 就变成 (5.5) 的第二 
种情况•将 (5.7) 式代入 （5.6) 式，得到 

m ( x ) = 1+ f m(x- y)dy 
Jo 


将上式求微商得到 
或 

将上式求积分，得 


或 



(作变量替换 u = x-y) 


m'(x) = m(x) 

榮 =1 


ln [ m ( x )]= 


m ( ar ) = ke x 


由 m ⑼ =1, 得 fc = 1，这样 

m ( x ) = e 1 

回到我们最早提出的问题,均匀随机数部分和超过1的最早时刻的期望值 m ( l ) 等 
于 e . ■ 


7.5.3 利用条件计算槪率 


我们不仅可以利用条件期望的方法计算—个随机变置的期望，也可利用此方法 
计算概率.设五为一随机事件， 令X为 E 的示性函数，即 


X 


1 丑发生 
0 £不发生 



由此， 
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E [ X ) = P { E ) 

E [ X\Y = y ] = P ( E\Y = y ) 对任何随机变釐 y 

这样，利用 （5.1 a ) 与 (5.1 b ), 可得到 

{ D P ( E\Y = y ) P(Y = y ) Y 为离散型随机变量 

v go (5.8) 

厂 P ( E\Y = y ) fy { y)dy Y 为连续型随机变童 

若 y 是离散型随机变量，并且只取值利用记号 F i = {Y = Vi }, 方程 
(5.6) 变成 

P ( E ) = Y i P ( E \ F i ) P { F i ) 

»=1 

其中 F lt ---, F n 互不相容，且这些亊件的和是一个必然事件,此时我们称它们形成 
一个完备事件组.这个公式就是概率的全概公式. 

例 5 k (最优奖问题）设有 n 个不同的奖陆续出台，当一个奖出来时，你可以 
拒绝或接受.当然，你接受了这个刚出台的奖，你不能再领以后出台的奖.若你拒 
绝刚出台的奖，那么你还有机会领以后出台的奖.当一个奖出台时，唯一的信息是 
刚出台的奖与己经出台的奖进行比较.例如，当第5个奖出台时，你只能与前4个 
己经公布的奖进行比较.我们的目标是希望得到最高奖，或找到一种策略使得得到 
最高奖的概率尽可能大.假设出台的奖项的 n ! 种次序都是等可能的 • 

解： 令人惊讶的是，我们可以得到很好的结果.对于固定的 fc ,0 < < n , 考虑 
如下的策略.首先拒绝前面 fc 个奖项，然后从第 + 1个奖项出台开始算起，只要 
发现新出台的奖项比前面己经发布的好就接受这个奖项，否则就拒绝这个奖项而观 
察出台的下一个奖项，记 P fc ( 最优）表示利用这个策略得到最优奖项的概率，记 X 
为最优奖项出台的次序，例如最优奖是第5个出台的奖，则 X = 5. 利用全概公式 

朽(最优)=最优 P = i ) P(X = i ) = i 史朽(最优 p = i) 

»=i n <=i 

若最优的奖项在前面的 fc 次发布,按这个选奖的策略,每次都拒绝拿奖，因此，不可 
能拿到最优奖.这样 

巧(最优 | X = i ) = 0 

另一方面,若最优奖的位置 i 在*之后，即 i > *, 那么就有可能拿到最优奖•如果 
前面 i - 1个奖项的最大值奖的位置在前面的 fc 个奖中，那么，随着奖的出台，一直 
到 i - 1都是拒绝领奖,直到最优奖 i 发布时，按规则接受最优奖.现在假定最优奖 
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位置在 i , 在前面 i - 1个奖项中，最高奖的位置在1，•••，<- 1处是等可能的.因此 
巧 (最优 |X = i 卜 前面 i -1 个奖中，最髙的奖项在{1，2,…， fc } 中 |X = i } 



这样，我们得到 


巧（最优 ) =^ 金^ $/二 ^ In ⑸ 


若考虑函数 
则 

因此 


g ’( x ) = 0冷 In (2) = 1 ^ 


由于忾（最优）* g ( k ), 当取 fc = n / e 时， P fc ( 最优）《 g ( n / e ) = 1/ e , 最优策略是首 
先拒绝前面 fc = n / e 个奖项，然后等待出现第一个比以前的奖项都大的奖项，并接 


受这个奖项.按这个策略，拿到最优奖的概率近似地等于 1 /e » 0.367 88. 


注释大部分人对于以这么大的概率拿到最优奖感到吃惊.一般认为这个概 


率当 n 很大时会趋于 0. 然而，即使不经稍确计算，稍微思考，就会发现拿到最优奖 
的概率会相当大.取 fc = n /2, 考虑这 n 个奖中的最高奖与第二最 高奖. 考虑一个 
随机 事件： 第二最高奖出现在前面一半，第一最高奖出现在后面一半.这个事件的 
概率为 1/4. 当这个亊件发生时，我们一定能选到奖，并且是最高奖.因此看出 ， n 
无论怎么大，总是能找到一种策略，使得得到最高奖的可能性超过 1/4. ■ 

例51设 f ； 为（0, 1) 上均匀分布的随机变量,又设在给定 U = p 的条件下，随 
机变量 A ： 的分布为二项分布,其参数为 ( n , p ). 计算 X 的分布列 • 


解 ：利用 X 的条件分布，可以计算 X 的分布列, 


P{X = i }= P{X = i\U = p }/ u ( p ) dp = / P{X = i\U = p}dp 


*! (n - »)!, 


p^l-p^-Mp 


又已知 


p^i-pr-Mp 


t !( n - i )! 

(n + 1)! 


(这个公式的概率证明可参见 6.6 节)，由此可得 

m = *} 


* = 0, ••- , n 
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由这个公式,我们可以得到一个令人吃惊的事实.如果将一个硬币连续掷 n 次，假 
定硬币的正面朝上的概率 P 的分布为 (0,1) 上均匀分布,则正面朝上的次数的分布 
*{0,1,•••,«} 上的均匀分布 • 

由于条件分布具有很好的形式，我们可以给出一个较为直观的解释，设1 
为 n + 1 个独立同分布的随机变量，每一个变童的分布为 （0,1) 上的 
均匀分布.令 X 为 Ul , - , Un 中小于 t / 的变量个数，由于队,…，和 f / 具有 
相同分布,在 n + 1个变量的排序过程中 y 为最小， f / 为第2小，…， C 7 为最大，这 
n +1 种可能性是相同的，因此 X 等于0,1,2,3, • •. ， n 这 n + 1种可能性也是相同 
的.又由于当给定 t / = p 的条件下， = … ， n 的个数的分布为二项分布, 
其参数为 ( n , p ). 这样， X 的分布具有很直观的解释. ■ 

例 5 m 设 X 和 y 为两个相互独立的随机变量，其密度分别为 / x 和 /y •计 
算 P{X < Y ). 

解： 先将 y 的值固定，利用公式 (5.8), 得到 

P{X < Y } = J °° P{X < Y\Y = y } f Y ( y)dy 

= 厂 P{X < y\Y = y } f Y ( y)dy 
= 厂 P { X < y } f Y ( y)dy 独立性 

= J Fx ( v )/ y ( l/)dy 

其中 

Fx(y) = J fx{x)dx ■ 


例 5 n 设 X , ^为相互独立的连续随机变量，其密度分别为 / xOc ),/ y ( l /) •求 


X + Y 的分布 • 

解： 利用公式 (5.8), 我们得到 
p{x + y < o } = / p{x + y < a|y = y } fv ( y)<iy 


P{X + y < a\Y = i /}/ y ( y)dy 

P{X < a - y }/ v ( y ) ds /= / F x(,a - y)fy(.y)^y 


7.5.4 条件方差 

我们既然可以定义 Y = y ZT X 的条件期望，也可以定义 F = J /之下 X 的 
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条件方差,它由下式定义 

Var ( A -| y ) = E [{ X - £[ X | y ]) 2 | y ] 

Var ( X | y ) 是 X 和它的条件期望之差的平方的（条件）期 望值. 或者，换句话说, 
Var ( JV | y ) 在 y 已知的条件下与通常的方差的定义完全一样，不过求期望的过程换 
成了求条件期望. 

条件方差和方差之间具有某种联系，人们通常利用这种关系计算一个随机变量 
的 方差. 首先,和普通方差的公式 Var ( X ) = E [ X 2 ] - ( E [ X ]) 2 -样，条件方差也有 
Var ( X | r ) = E [ X 2 \ Y ] - ( E [ X \ Y \) 2 

由此得到 

E { Vbx ( X \ Y )) = E [ E [ X 2 \ Y \] - E [( E [ X | y ]) 3 ] = E [ X 2 } - £[( E [ X | r ]) 2 ] (5.9) 

同时， 

Var 剛 y ]) = £? [剛 y ]) 2 】- { E [ E [ X \ Y }}) 2 = E [( E [ X \ Y )) 2 } - 剛 ) a (5.10) 
将 (5.9) 式与 (5.10) 式相加，我们得到如下 命题： 

命题 5 .2 (条件方差公式） 

Var ( X ) = £[ Var ( X | F )] + Var (£；[ X | yi ) 


例 5 o 设在任何长度为 t 一段时间区间 (0, t ) 内到达某火车站的人数是一个 
服从泊松分布的随机变量，均值为 Af . 现设火车在 (0. T ) 这个区间内随机到达，即 
到达时间是 （0， T ) 上的均匀分布，并且它与到达火车站的人数 独立. 求火车到达时 
上火车的旅客人数的期望和方差. 

解：记 N ( t ) 表示 t 以前到达车站的人数， y 表示火车到达时间，能够上火车 
的人数为(假定火车到达后立即开走，而 Y 以后到达火车站的人只好等下一 
班火车).把 y 的值固定，设为条件，得 

E [7 V ( y)|y = t ] = E ( N ( t)|y = t ) = 五 [况⑹ 由 y 与 N ( t ) 的独立性 

=Xt N ( t ) 是泊松随机变量，平均值为 At 

因此， 

E [ N { Y )\ Y ] = Ay 

两边求期望,得到 

yr 

£[ iV ( r )] = XE [ Y ] =— 

为求 Var ( iV ( y )), 利用固定 y = t 之下的条件方差公式 
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Wbs { N { Y)\Y = t )= War { N ( t)\Y = t ) 

= Var ( iV ( t )) y 与 N ( t ) 独立 
=Xt 


故 


var(jv(y)|y) = Ay,E[N(y)|y) = Ay 
再利用命题 5.2 的条件方差公式，得 

1 )?T^ 

Var (7 V ( y )) = E [\ Y ] + Var ( Ay ) = - AT + — 

其中，利用了 y 的方差 Var ( y ) = T 2 /12. ■ 

例 5 p (随机个数随机变量之和的方差）设&,&，••• 是一个 独立同分布的 
随机变量序列， N 是一取自然数的随机变量，并且独立于序列 { Xi,i > 1}, 为计算 
Var ^^ Xi ), 先固定 TV 的值作为条件 

E ^ Xi |7 vj = AT 綱， Var = NWax { X ) 

其中； f 的分布与的分布相同.再利用条件方差公式可得 


Var ( E X *) = ^] Var ( X ) + (£；[ X ]) 2 Var ( iV ) 


7.6 条件期望及预测 

有时候，在实际问题中会遇到这种情况，某人观察到随机变量 X 的值，基于 X 
的观察值，要对第二个随机变量 F 的值进行预测，通常用 9 W 表示预测值，即当 
A ■的值 a : 被观察到以后, 〆 ： r ) 就是 y 的值的预 测值. 当然，我们希望选择接 
近 y , 选择 ff ( x ) 的一个准则是极小化 £[( y -</ W ) 2 ]. 现在我们指出在这个准则 
之下, y 的最好的预测值为 9( X ) = E [ Y \ X }. 


命題 6.1 

E [( Y - 9 ( X )) 2 ] > E [( Y - E [ y | X ]) 2 ] 


证明： 

E [( Y - g ( X )) 2 | X ] = E [{ Y - E [ Y \ X ] + E [ Y \ X ) - g { X )) 2 \ X ] 

= E[(y - E [ y | X ]) a | A -] + E [{ E [ Y \ X ] - ff ( X )) 2 | X ] 
+ 2 E[(Y - E [ Y \ X ])( E [ Y \ X ) - ff ( X ))| X ] 

然而,对于给定的 X 值， E [ yjX ] - S ⑷就是一个常数，因此 



( 6 . 1 ) 
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E[(Y~ E[Y\X])(E[Y\X] - 9 (JC))|X] 


=( E \ y \ X ] - g ( X )) E \ y ~ E [ Y \ X )\ X ] 

=(£ ； [y|A-] - s(x))(B[y|x] - E[y|x]) = o (6.2) 

这样，由 (6.1) 式和 (6.2) 式可得 

E [( Y - g ( X )) 2 \ X ] > E [( Y - E \ y \ X ]) a \ X ] 

上式两边再求期望即可得到命题的结论. □ 

注释此处可以给出一个更加直观的证明，当然，在证明的严格性上要差一点. 
很容易证明 E [( Y - c ) 2 ] 在 c = 时达到极小值 （ 见理论习题 1). 因此在我们没 

有任何数据可用时，在均方误差最小的意义下， F 的最优预测就是 E [ Y ]. 现在设 
得到了 X 的观察值此时预测问题与没有数据时的预测问题完全一样，只是原来 
Y 的期望改为事件 {X = a ：} 之下的条件 期望. 因此， y 的最优预测是 K 在 X = a : 
之下的条件期望. ■ 

例 6 a 设身高为 a : 英寸的父亲,其儿子的身高具有正态分布，均值为 *+ 1,方 
差为 4. 现设父亲的身高为6英尺，试预测其儿子成长以后的身高. 

解： 设父亲身高为儿子身高为 y , 两者关系可表示为 
Y = X + l+e 

其中 e 为正态随机变置，独立于 X ,并且期望为0,方差为 4 .对于6英尺的父亲, 
其儿子身高的最优预测为 E [ Y\X = 72]. 

E \ Y\X = 72] = E[X + 1 + e\X = 72] = 73 + E [ e\X = 72] 

= 73 + E { e ) 利用； f 与 e 的独立性 

= 73 ■ 


例 6 b 设 A 处发射一个强度为 S 的信号，在 B 处会接收到一个强度为/{的 
信号，是一个正态随机变量，其期望为方差为 1. 现在设发射端的信号服从正 
态分布，其期望为 M , 方差为 当接收端收到的的值为 r 时，求发送信号的最 
优估计？ 


解： 首先计算发射端发送信号的 S 在给定之下的条件密度 

fs\R(.s\r) = = 众 ( 8 )/ 邮 ( 十 ) = /f e -(*-M» a e -(r-*) a /2 

其中 A ： 不依赖于 S . 注意下面的恒等式 

^^ = * J (i + 0-(? +r ) a+Cl 
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其中 Ci,C 2 均不依赖于 S , 因此条件密度为 


fs \ R { s \ r ) = Cexp 


其中 C 与 S 无关.由上式可知，在给定 R = r 之下, S 的条件分布为正态分布，其 
期望和方差分别为 

E[S\R = r) = ^^.Var(5|fl = r) = ^ 

再利用命题 6.1, 在给定 fl = »•之下，对 S 的均方误差最小的估计为 
E [ S\R = r ) = T l^^ +T ^ i r 

由上式看出，条件期望提供了关于 S 的信息.它是 m 和 r 的加权平均.而两个权 
值之比为1与 tr 2 . 其中1代表信号 S 发出后接收到的信号的条件方差.而 <7 2 表 
示发送信号的方差.发送信号的方差越大， / x 的作用越小 （ M 代表先验信息)，同时, 
接收到信号的条件方差代表传播信号的误差（现在为1)，这个误差越小，则 r 的作 
用越大. ■ 

例 6 c 在数字信号处理过程中必须把连续数据离散化.其过程 如下： 取一组递 
增数列， a<,t = 0, ±1, ±2, • ■ • ,使得. lim^Oj = oo ,^ lim ^ o < = — oo . 当 X € ( ai , o <+ i ] 
时，选一个代表值 W , 这样将连续 SSk 散化.表示离散化后的值 ， Y 与 X 
之间有如下的 关系： 

V = Vi ai < X K eii+i 

y 的分布由下式给出 

P{Y = yi} = F x {ai+i) - Fx(ai) 

现在我们的目标是要选择各区间的代表值 i/ il i = 0,± l ,±2,- -, 使得 E[{X - Y ) 2 } 
达到极小. 

⑷找到最优值 i = 0, ±1, • • • • 

对于最优的 y , 指出 

( b ) E \ Y } = E [ X ], 也即均方误差最小意义下的离散化保持均值不变. 

( c ) Var ( y ) = Var ( X ) - E[(X - Y )% 

解： （ a ) 对于任意的离散化随机变童 y 利用命题 5.1 的结果，有 

E[{X - Y ) 2 ] = [瓦 [(X - y<) 2 |oi < X 《 Oi+ilPfOi < X ^ 屯 +1 } 

令 

I = i di < X Oj + i i = 0,±1, • • • 
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则 


寧 - yi) 2 |ai < X < Oi +1 ]= E[(X- yi) 2 \J = {\ 


利用命题 6.1 的结论，当 

=刷/= 和聊 叫 < 以叫卜 Fx ^ x l% M 

时， E [{ X - yi ) 2 \ai < X 《< n +1 ] 达到极小值.因此， y = E [ X \ I \ 是最优的离散化随 
机变童.在最优的选择之下 


( b ) E[Y) = E[E[X\I)] = E\X\ 

( c ) Var ( X ) = £；[ Var ( X |/)] + Var (丑刚 ） 

= E[E[(X - y ) 2 |/]] + Var ( y ) = E[(X - F ) 2 ] + Var ( y ) 

显然 成立. ■ 

在某些情况下，义和 y 的联合分布不完全知道，或者，即使联合分布知道, 
E[Y\x = X) 的计算也十分复杂.然而，如果我们知道 A ■和 y 的期望、方差和相关 
系数，我们至少可以求出依赖于 x 的最优线性预测. 

为求得 y 的最优线性预测，我们需要选择线性预测 a + bX 的系数 a 和& ,使 
得 E[(Y - (a + 6 X )) 2 ] 达到极小值.为此，先将 E[(Y - (a + 6 X )) 2 ] 展成一个 a , b 的 
多 项式： 

E[(Y - (a + 6 X )) 2 ] = E[Y 2 - 2aY - 2bXY + o 2 + 2abX + b 2 X 2 } 

= E[Y 2 ] - 2aE[Y] - 2bE[XY] + o 2 + 2abE[X] + b 2 E[X 2 } 


将上式对 a 和求偏导数得到 

i-E[{Y - (a + WQ ) 2 ] = -2E[Y] +2 a + 2bE[X] 

(6-3) 

^E[(Y - (a + W ：))*] = -2E\XY] + 2aE[X) + 2bE[X i ] 

令偏导数为0,求解关于 ( a , 6) 的方程组 (6.3), 得到 

E[XY] - E[X]E[Y] Cov ( X , y ) _ a v 

酬-剛 ) 2 ol ~ (64) 

a = E\Y)~ 6£[ X ] = E[Y]- 

其中 p 为的相关系数 ，4 = Var ( y ), a 2= Var ( X ). 容易验证由 （6. 4 ) 给出的 
M 值使得 E[(Y- (a + 6 X )) 3 ] 达到 极小. 因此,在均方误差意义下, y 的最优线性 
预测为 

hi + - M*) 

Ox 


其中〜 = E\Y],^ = E[X). 
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这个线性预测的均方误差为 

五 艺 (x-a)) 2 ] 

= E[(Y- ny) 2 ] + P 2 ^E[{X - / i x ) 2 ] - 2p^E[(Y - Hy)(X - ^ x )] 

=al + p 2 <rl~ 2p 2 al = < rj(l - p 2 ) (6.5) 

由 （6.5) 看出，当 p 接近于 +1 或- 1 时，其最优线性预测的均方误差接近于 0. 

例 6 d 当及 y 的联合分布为二元正态分布时，由于 X 给定之下 y 的条件期 
望为X 的线性函数，因此 y 的最优线性预测就是最优预测，在第6章例 5 c 已经 
给出，在正态情况 

E\Y\X = x] = Hy + p—{x - n x ) ■ 

Ox 

7.7 矩母函数 

随机变量 A ： 的矩母函数 M ⑴由下式定义 
财⑴= £[ e tx ] 

{ ^e tx p(x) 久离散， p ( a :) 为其分布列 

厂 e tx f(x)dx X 连续, /( z ) 为其密度函数 

其中 t 为实数.我们之所以称 M ⑴为矩母函数，其原因是 X 的所有阶矩都可以从 
M[t) 在《 = 0的各阶微商得到.例如 

M'{t) = ^£；[ e tx ] = E [去 ( e tX )] = E[Xe tX ) (7.1) 

其中我们假定微商和期望两个运算可以交换次序，即我们假定在离散情形下，下式 
成立 

在连续情形下， 

l [/ e -/( x ) dx ]=/ l [ e -/( x)]dx 

这个假定在通常情况下能够验证.特别是本书中提到的分布，都能满足上述要求 • 
因此，在 (7.1) 中，令* = 0,得 


= E [ X ] 
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= 去对’⑴ = 备断 X ' =丑[去(办认)]= E [ X ^ x ) 


M 〃⑼ = E[X 2 ] 


一般地，对 Af ⑷求 n 次导数可得 


Af (n) (i) = E[X n e tX ] n 彡 1 


M ( n \0) = E [ X n ] n > 1 
现在我们对某些常见分布计算 M ⑷. 

例 7 a (二项分布(参数为 （ n , p ))) 设 X 具有二项分布，参数为 （ n , p ), 则 
从⑴= f ；[ e tx ] = ^ e tfc («) p fc (l - p) n ~ k 

fc =0 

= E ( J )( pe *) fc ( l - P) n ' fc = ( pe * + l-pr 

fe =0 ' 

最后一个等式利用了二项式展开定理.两边求微商可得 
M \ t ) = n ( pe * + 1 - p ) n -1 pe * 

故 

E \ X \ = M \0) = np 

再求一次微商得 

M "( t ) = n(n - l )( pe J + 1 - p ) n ~ 2 ( pe 1 ) 2 + n ( pe * + 1 - p ) n _1 pe * 

故 

E [ X 2 ) = M 〃(0) = n(n — l ) p 2 + np 

X 的方差为 

Var ( X ) = E [ X 2 ] - ( F [ X]) a = n(n - l ) p 2 + np - nV = np ( l - p ) 
这验证了之前所得的结果. 

例 7 b (泊松分布（参数为 A )) 设 X 的分布为泊松分布，参数为 A , 则 

°° _ tn _- A \n 

M { t ) = E [ e tx ] = ―— 


= e - A e Ae， = exptACe 4 - 1)} 



求微商可得 
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M'{t) = Ae 1 exp { A ( e 4 — 1)} 

M 〃( t ) = ( Ae *) 2 exp { A ( e t — 1)} + Ae * exp { A ( e 4 — 1)} 

由此可得 

E[X] = M'{0) = X 
E[X 2 ) = M w ⑼ = A 2 + A 
Var(X) = E[X 2 ] - (E[X]) 2 = A 

因此,泊松随机变量的期望和方差均为 A . ■ 

例 7 c (指数分布(参数为 A )) 

MW = £【 e tJc l = / e t 3： Ae- Al di 
Jo 

= e - ( A - t ) l da : = -^- t 对 t < 入 

由上式可知，指数分布的 M ⑴只对 f < A 有定义.对 M ⑴求微商， 

m ， W =( a ^ m ，， W =( a ^ 

因此 

E [ X ] = M ’ ⑼=去 E[X 2 ) = M "(0) =去 

其方差为 

Var(X) = B[A- 2 ]-(£ ； [X]) 2 = ^ ■ 

例 7 d (正态分布）首先计算标准正态随机变量的矩母函数•令 Z 为该标准正 
态随机变置， 

m zW = e [^ i =- i = jy-^^ {- xl ^ £ } dx 

因此,标准正态随机变量的矩母函数为 M z { t ) = e t 2 /2. 对于一般正态随机变童，只 
需作变换（见5_4节 )； f = M + « rZ 其中 / t , ^是久的期望与方差， Z 为标准正态随 
机变量.此时 

财久⑷ = E [ e tx ] = E [^ +aZ) ] = E ^ e 102 ] 

= e tM £[ e t<TZ ] = e t # * Afz ( tcr ) — e tM e (tff)a/2 = exp |^- +/ x <| 
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求微商，可得 ^ 

M'x(t) = (/i + ta 2 ) exp | + /xt J 

M^(t) = (M + *<r 2 ) 2 exp| ^ - +/i«J +^exp| + #} 

由此可得 

E[X] = M\0) = /i 
E[X 2 ] = M 〃⑼ =n 2 + ff 2 

因此， 

Var(X) = E[X a ] - (£[X]) 2 = a 2 

表 7.1 和表 7.2 给出了某些常用的离散和连续分布的矩母函数. 


表 7.1 离散槪率分布 

分布列 矩母 a 数 均 值方龜 


二项分布 

参数 (n,p),0<p< 1 

* = 0,1,- - ,n 

{p» l + l-p) n 

np 

tip(l - p) 

泊松分布 
参数 A>0 

i = 0,1, • • • 

exp{A(e« - 1)} 

A 

A 

几何分布 
参数 0 < p < 1 

P(l-P)— 1 
x = 1,2, ••- 

pe« 

1 - (X - p)e l 

1 

P 

1 -p 

7 

负二项分布 
参数 r,p;0<p< 1 

( n r Zl)p r ^-P) n ~ r 

[l-(l-p)e«] 

P 

r(l - p) 


表 7.2 连续《率分布 


密度函数 

矩母函败 

均 值方 差 

f ； - a K x < b 

(a, b) 上均匀分布 /(z) = { b _ a 

[o 其他 

- e ,a 
t(6 - a) 

a + b (b - a) 2 

2 ~ 12 ~ 

指数分布 .. Ae- Ax x>0 

参数入 >0 1 |o I < 0 

xh 

1 1 

A ^ 

f Xe-^iXx)— 1 

r 分布 /(x)= r W … 

，数 (*,A),A>0 |o x< 0 


A ^ 

正态分布 /(I) = ▲一 )2/ 以 
参数 (ji,a 2 ) — oo < x < oo 

exp{iit + <7** 2 /2} 

/* 


矩母函数的一个重要性质是，独立随机变量和的矩母函数等于诸随机变量各自 
矩母函数的 乘积. 设 A ■和 r 为相互独立随机变量，其矩母函数分别为&⑷和 
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记 M x + Y ( t ) 为 X + Y 的矩母函数，则 

M x+y ^) = £[e t(x+y> ] = E [ e tx e tY ] = E [ e tx ] E [ e tY ] = M x (t)My ⑴ 

其中倒数第二个等式利用了命题 4.1 关于独立随机变童乘积的期望的计算公式. 

矩母函数的另一个重要特性是，矩母函数唯一地确定了分布.设⑴是X 
的矩母函数，并在 t = 0的某一邻域内有定义且有限，则久的分布被 M x (t) 所唯 
一确定.例如，若 

Mx(«)=(^)V + l) 10 ； 

则由表 7.1 可知X的分布为二项分布，参数为 （10 , 1/2). 

例 7e 设随机变量X的矩母函数 M ( t ) = eW-n ，求 P{X = 0}. 

解： 由表 7.1 知， M ( t ) = 是泊松随机变量，参数为 A = 3,这样， P{X = 

0} = e_ 3 . ■ 

例 7f (独立的二项随机变量的和）设X和 y 为相互独立的二项随机变量，其 
分布参数分别为 （r»,p) 和 ( m , p),X + Y 的分布是什么？ 

解： X+Y 的矩母函数为 

M x + y ( t ) = ⑷ MHO = ( pe 4 + l - P ) n ( pe * + 1 - p) m = ( pe * + 1 - p) n+m 

然而， ( pe * + 1 - p ) n + m 是二项分布的矩母函数，其相应的参数为 (n + m , p ). 由矩 
母函数唯一确定分布，知 X + y 的分布为二项分布，参数为 （n + m , p ). ■ 

例 7 g (独立的泊松随机变董的和）设 X ， y 为相互独立的泊松随机变童，相应 
参数为 A :, A 2 , 求 X + V 的分布. 

解：由 Mx+y ⑴ =Mx ⑴脚⑷ 

= exp{Ai(e* - l)}exp{A 2 (e t - 1)} 

= exp{(Ai + Aa)(e 4 — 1)} 

知 A" + y 的分布也是泊松分布，分布参数为 Ai + A 2 , 这验证了第6章例 3e 的 
结果. ■ 

例 7h (独立正态随机变董之和）设X和 F 为相互独立正态随机变量，其参 
数分别为 （Pi,4) 和 （w|). 则 X + F 也是正态分布，期望为 Mi + M2, 方差为 
a \ + 4. 

解： M x +y{t) = Mx ⑴脚⑴ 

= exp|^j- +/xit|exp|^y- +M2«| 

=exp {feL^ +(m+w) ,} 
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这个函数是期望为 Mi+W ,方差为 (r\+al 的正态随机变量的矩母函数.由 
于矩母函数完全确定其分布函数， 故 X + Y 的分布为正态分布，其期望为 / XJ +/ X 2, 
方差为 a ? + tr |. ■ 

例 7 i 计算自由度为 n 的 X 2 分布的矩母函数. 

解： 我们将具有 x 2 分布的随机变量分解成 z^ + ... + zl 其中&，…， Z „ 为 
相互独立具有标准正态分布的随机变量，令 M[t) 为其矩母函数.由前面论述可知 
M(t) = (E[e tzl ]) n 

其中 Z 为标准正态随机变量.现在， 

= vfe/ 00 e ~ x3/2，，2dx 其中 = (! - 2t) _1 
= <r = (1 - 2t) _1/a 

上述最后第二个等式利用了 “密度函数之积分为1”的结论.因此 

M ⑴= (1 - 2t)~ n/2 ■ 

例 7 j (随机个数随机变量之和的矩母函数）设 X U X 2 ，… 为一独立同分布随 
机变量序列.又设 W 为取值于正整数集合的随机变量，且与 Xi,i > 1相互独立. 
现在需要计算 

N 

i=l 

的矩母函数.（在例 5 d 中 y 可以解释为某一天百货公司的营业额，它是某一天顾 
客消费的总和，此处每一个顾客的消费额，以及顾客人数都是随机变量 .） 

首先，求出 7 V 固定之下的条件期望 • 



E[e iy |N] = (M X ⑴广 


这样 


M Y {t) = £[( M x ( t )) N ] 



利用微分法 
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M“t) = E [ N ( M x { t )) N ^ M ' x { t )] 

故 

E [ Y ] = MWO} = £[W(Mx ⑼严 mmKO )】 

= E [ NE [ X }] = B[7V]f；[X] (7.2) 

验证了例 5d 的结论.（上述论证中，我们利用了 M X (0) = E [ e ox ] = 1这一结论 .） 
同样，由 

M?(i) = E [ N ( N - 1)(M X ⑷广 2 (叫⑻ ) a + NiMxit ^ M ' Ht )} 


得 

E[Y 2 } = MMO) = E[N(N - l)(E[X]) a + AT 五 [X 2 ]] 

=(E|X]) 2 (£[7V 2 ] - E[N]) + E[^]S[X 2 ] (7.3) 

=E[iV](E[A- a ] - (£[X]) 2 ) + (EIX^EIN 2 ] 

= E[N]Vai(X) + (£[X]) a E[AT 2 ] 


由 （7.2) 和 (7.3), 得 

Var(y) = S[iV]Var(X) + (E[X]) 2 (E[7V 2 卜 (£[^) 2 ) 
=£(7V]Var(A-) + (E[X]) 2 Wfu(N) 


例 7k 令 y 为具有 （o,l) 上均匀分布的随机变童，假定当给定 v = p 的条件 
T, X 的分布为二项分布，其参数为 (n,p). 在例 5k 中我们已经推出X的分布为 
有限点集 {0,1, •••,«} 上的均匀 分布. 现利用矩母函数方法建立这个结论. 

解： 首先将 y 的值固定，在 y 值固定的条件之下，利用二项分布的矩母函数 

得到 

E[e tx |y = p] = (pe t + l-p) n 

由于 y 又是 (0,1) 上均匀随机变量，对上式求期望得 


£[e tx ] = 


(pe* + 1 - p) n dp = 


1 r** 

/ y n dy 作变量替换 y = pe* + l-p 


e t(n+l)-l 


-i-fl + ^+e 2 * + ••• + e nt ) 
n + 1 


上述函数是有限集合 {0,1 ， ... ， n} 上均匀分布的随机变量的矩母函数.由于矩母函 
数唯一确定其分布，因此 A" 的分布就是{0,1, • ■ • ， n} 上均匀 分布. _ 

联合矩母函数 

我们可以把矩母函数推广到两个或多个随机变量的联合矩母 函数. 设為，…， X„ 
为随机变量序列，其联合矩母函数由下式 定义： 
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M{h, … ， t„) = 

Xi 的矩母函数可以从联合矩母函数 M ( t lr -, tn ) 中得到 ，即： 

M Xi (t) = E[e tXt ] = Af(0, … ， 0, M) ， … ， 0) 

其中 t 的位置刚好在第 i 个变量的地方. 

可以证明， ， X„ 的联合矩母函数唯一地确定了它们的联合分布.这个结 
论的证明已经超出了本书的范围.利用这个结论，可以证明， X lt -,X n 相互独立 
的充要条件是 


M ( ti , ■■- , tn ) = M Xl ( ti ) ■ ■ ■ Mx n ( t n ) (7.4) 

若& ，…， 义„相 互独立，则 

M ( t u • • •,<„) = E[e (tlX,+ • +t " x " ) ] = E [ e ttXl - - - e tnX "j 
=E[e t,x, j- •- £[e 4 " x "] 由独立性 
= Mx l { ti )-- Mx n ( t n ) 

另一方面，若 (7.4) 式成立，我们首先指出 (7.4) 式两边都是矩母函数，等式右边 
与分布函数 Fx ^ x ^'- FxAxn ) 相 对应. 等式左边与 （A ，…， X„) 的分布函数 
F ( X lt ■■- ，足 0相对应.由于矩母函数唯一确定分布函数， （7.4) 说明对任意 n ，…， 
x n ， 有 

F ( xi ，…， a:„) = Fx, (®i) … (a：n) 

其中为&的分布函数.这个等式说明 X l } --, X n 是相互独立的 • 

例 71 设 X 和 y 为相互独立且同分布的正态随机变量，期望为 M, 方差为 cr 2 , 
第6 章例 7a 证明了久+ 7与久_ ^相互 独立. 现在用矩母函数的方法证明这个 
结论. 

£；[e t <- v+v)+,(X - y) ] = E[e( t+,)x+(t -* )y ] = S[e (t+ * )x ]f；[e (t -* )y ] 

_ ^ i { t + t )+ a a (t+«) a /2 e M(t-*)+iT 2 (t-*) 3 /2 
= e 糾 +a a y = 

利用随机变量独立的充要条件 （7.4), 可知 x + f 与 x-y 是相互独 立的. ■ 

下面我们用联合矩母函数的方法去验证第6章例 2 b 的结论 • 

例 7m 假设出现的事件数是一个随机变量，其分布为泊松分布,参数为 A. 又 
假设这些事件独立地以概率 P 被记录下来，指出记录下来的事件数和未记录下来 
的事件数是相互独立的泊松随机变量，其参数分别为 Ap 与 A(l-p). 

解：记 X为事件发生数，为记录下的事件数，则未记录下来的事件数为 
X - X c , 首先计算条件矩母函数. 
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E [ e ,x - + ^ x ~ x ^\X = n ] = e tn £[ e ( •- t)Xe |X = n ] 

= e tn ( pe s-t + l - p) n = ( pe s + ( l - p ) e t ) n 

上述推导用到如下事实，在 X = n 的条件下,的分布为二项分布,参数为 ( n , p ). 
由此可得 

S | e .x e +t(x-x e )| X ] = (pe* + (l-pje 4 )^ 

上式两边求期望得 

^| e . x e + t ( x - x c )] = E [(pe • + ( l - p ) e t ) x ] 

由于 X 为泊松随机变置，参数为 A , 故 E [ e tx ) = 对任何正数 a , 可表示为 

a = e *, 可知 E [ a x ] = e ^ 1 ). 这样， 

£；[ e » X c + t ( X - X c )j _ e A ( pe *+( l - p ) e '- l ) _ e Ap ( e *- l ) e A ( l - p )(«*- l ) 

上式中，令 f = 0, 得 类似可得 = eMi - PKW - i ) ,故 

X c 与 X - X c 均为泊松随机变童,其参数分别为 Ap 和 A (1 - p ). 同时,下式成立 

£；[ e * Xc + t ( X - X 0 )j _ f ；[ e «^ c ]£；[ e t ( X - X.)j 

由随机变量相互独立的充要条件 (7.4) 知 ，兄与 A ■- 兄: 相互 独立. _ 

7.8 正态随机变量进一步的性质 

7.8.1 多元正态分布 

设 A ，…，为 n 个相互独立的标准正态随机变置，若 A ，…，可以表示 
如下： 

Xi = O11Z1 + • • - + ai n Z n + Hi 
X 2 = anZi + • • • + a2„Z n + nz 

Xi = OilZ \ + • • • + ClinZn + Mi 

X m = Om \ Z \ H - h OmnZn + Hm 

其中 Oij ,\ 1彡_7■彡 n 和 / ij , l 彡 i 彡 m 均为常数•则 Xi , …， X m 称为具有 

多元正态 分布. 利用独立正态随机变釐之和仍为正态随机变量之事实可知， Xi 为 
正态随机变童，其期望和方差分别为 

S [ X <] = Hi , Vax ( Xi ) = y^Qjj 

现考虑它们的联合矩母函数 

M ( ti , - - - , tm ) = £[ exp{fiXj + • • • 4- t m X m }\ 
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由于 ET = itiXi 本身是 z ^- ^ Zn 的线性组合，故为正态随机变童，其 
期望和方差分别为 





= Cov 


i=l j=l 


对于一般的正态随机变量 y ，我们有公式 


E[e Y } = M Y (t)\ t=1 =^ 3 ^ 

其中 M = E [ Y ],< t 2 = Var(y). 将上述公式应用于 F = *<兄 ， 得 

M ( ti , = _B[e y l = exp{£；[yj + Var(y)/2} 

=exp I + ^ UtjCov(XiXj) 

[«=1 L i=l j=l 

由上式可知， X u …， X m 的联合分布完全由 五 [X<] 和 Cov(Xi, Xj),i = l ,-- , m,j 
l,- - •，m 所确定 • 

不难指出，当 m = 2 时，此多元正态分布就是二元正态分布 • 

例 8a 设 X，y 具有二元正态分布，其参数 


Hx = E [ X],iiy = E [ Y],al = Var(X),o-J = Var(y), p = Con ( X , Y ) 


求 P{X < Y }. 

解： 由于 A： - y 也是正态分布，其均值为 


E \ X - Y \ = ti x - ti v 


方差为 


Var(X - Y ) = Var(X) + Var(-K) + 2Cov(X, - Y ) 

= crl + < rl - 2 pa x < r v 

由此可得 

P{X < Y } = P{X - Y <0} 

X -Y Hy ) < -(fix - My) 

yjal + al - 2 pa x a v ^ + a 2 _ 2 pa x a y 

AH, - Mi 
+ < rl ~ 2 fKT x < T v 

例 8b 设 X 在给定 e = 0 之下为正态随机变量，其期望为0,方差为 1. 进一 
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步假设 e 本身也是正态随机变量，其均值为 m ， 方差为求出给定 x = xZT 
的 e 的条件分布. 

解： 我们不用贝叶斯公式.我们指出 (X,Q) 具有二元正态分布,其联合分布密 

度为 

fx,e{x,0) = fx\e(x\9)f e (0) 

其中， fx \ e ( x \ 9 ) 为正态密度函数，期望为0，方差为 1. 直接计算可以得到 fx \ e ( x , 9 ) 
也是一个二元正态密度函数.但是我们也可以这样看，令 Z 为标准正态随机变量, 
独立于 0. 则给定0 = 0之下， Z + Q 的分布为正态分布，期望为0,方差为 1. 显然 
(z + e , e ) 与 ( x , e ) 具有相同的联合分布，由多元正态分布的定义知， (^ + 0 , 0 ) 
显然具有二元正态分布，这样， ( X ,0) 也具有联合正态分布 密度. 现在 
E[X] = E[Z + Q\ = n Var(X) = Var(Z + 0) = 1 + a 2 


且 


p = Corr(X,e) = Corr(Z + e ,6) 

Cav(Z + 0,0) _ <7 

= v/Var(Z + e)Var(e) "* y/l+ ^ 

由于 (X,0) 为二元正态分布，因此 X = ：r 之下 e 的条件分布为正态分布，其期 
望为 

E[Q\X = i] = £；[©] + (( 贯 (:- 五 [ 义 ])= M + 1^5 (* 一卩） 


方差为 

Var(0|X = i) = Var(0)(l - p 2 ) = 1 ^ g2 
(关于二元正态分布的条件分布的计算可见第 6 章例 5c.) 


7.8.2 样本均值与样本方差的联合分布 

设，…， X „ 为独立同分布正态随机变量序列，其公共分布参数为 
记 X = T , U x i / n 为样本均值，由于独立正态随机变童的和也是正态随机变量，因 
此 X 也是 k 态随机变量，其期望为 M ， 方差为 cr 2 /n (见例 2 c 和例 4 a ). 现在研究随 
机变量序列 X , Xx - X ,- - , X n - X , 由例 4 e 可知 

Cov(X,Xi-X) = 0 i = l,...，n (8.1) 

现在设 y 为正态随机变量，且与 , X „_ X 相互独立，其期望为 M ， 方 
差为 a 2 /n, 不难验证 -X, - ,X n -X 为联合正态随机 变量. 另一方面， 
随机变量组 X,X 1 -X, - ,X n -X 也是联合正态的随机 变量. 同时，可以证明 
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Y , X !- X ,-- , X n - X 的期望和协方差与尤, A - X ， …，的期望和协方 
差完全相同.由于联合正态分布完全由其期望和协方差所确定，因此这两组随机变 
量具有相同的联合 分布. 这样，就证明了 又与 Xy - X , … , X „ - X 也相互独立. 
因此, 文与炉= E ?= 1 ( X < - X) 2 /(n - 1) 也相互独立 • 

我们已经知道 又与 S 2 相互独立，且尤为正态随机变量，参数为余 
下的，我们只需求出 S 2 的分布.在例 4 a 中，给出了恒等式 

(n-l)S 2 = Y,(Xi-X) 2 = ^(Xi-^-niX-n) 2 
»=1 «=1 

两边除以 a 2 , 我们得到 



是相互独立的标准正态随机变量的平方和，因此其分布为自由度为 n 的 x 2 分布, 
再由例 7 i , 可知其矩母函数为 （1 _ 2 t )-"/ 2 •同样 

(爲） 

的分布是自由度为1的 X 2 分布，其矩母函数为 ( l -2 i )- I/2 . 利用独立随机变最和 
的矩母函数等于各随机变量矩母函数的乘积的性质，得 

£ [ e J ( n - l ) SV«» 2 ](l _ 2 t )~ l/2 = (1 - 2 t) _n/a 


£：| e t(n-1)sa/,,!l ] = (1 - 2 t )~ (n_1)/2 

等式右边 （1 - 为 x 2 分布的矩母函数，自由度为 （ n-1), 由矩母函数唯 

一确定分布知， （》i - 1)5 2 /^ 2 的分布为自由度 （n - 1) 的 X 2 分布 ■ 

综上所述，我们有下述结论. 


命题 8.1 ^. X ir --, X n 为独立同分布的正态随机变量序列，其公共分布 
参数为(/1,<7 2 ),则样本均值 X 与样本方差 S 2 相互独立•尤为正态随机变 
量，均值为叫方差为 <7 2 /«5 (n-l^/cr 2 为 X 2 随机变量，自由度为 (n-1). 


7.9 期望的一般定义 

至此，我们只给出了离散和连续随机变量的期望的定义.然而，有些随机变量 
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既不是离散型的，也不是连续型的，它们照样可以有期望值.可以举出一个简单的 
例子.设 x 为伯努利随机变量，其分布参数为 p = 1/2. 又设 y 是一个[0,1〗上的 
具有均匀分布的随机变量，又假定 X ， Y 相互独立.现定义一个新的随机变量 

{ X X = 1 
Y X ^\ 

显然 ，泌 不是离散的（它的取值范围为 [0,1]), 也不是连续的 ( P{W = 1} = ^). 


为了定义-般随机变量的期望，我们需要给出斯蒂尔切斯积分的 概念. 首先， 
对于实函数 g ， 积分 f " g ( x ) dx 是通过下式定义的 


其极限过程是这样定义的，对于的分点 ， a =吻< an <...<% = 6,当 
max (xi - Xi-i) —* 0和 n — » oo 时，求相应和数的极限 • 

对于任意一个分布函数 F(x), 非负函数 g ( a :) 在区间上的斯蒂尔切斯积 
分是这样定义的 

广6 " 

/ g(x)dF(x) = lim ^ 5 (*<)[^(* t ) -作*-1)1 

Ja i=l 


f p ( x)di = lim [ ff (. x i)( x t 

•^ a i=l 


其中的极限过程与通常积分定义中的过程一样，即 a = < 々< ••• < a :„ = 6, 

max ( Xi - Xi . x ) — 0, n — oo . 进一步，在实数轴上的斯蒂尔切斯积分由下式定义 

t=l, …， n 

[ g { x ) dF ( x ) = lim / g ( x ) dF { x ) 


最后，对于-般的函数 s ， 定义 
9 + {x) 


9 { x ) g { x ) ^ 0 
0 g ( x ) < 0 



9 { x ) > 0 

g(x) < o 


0+ 和 3 -都是非负函数，称作9的正部和负部， 3(1) = 9 + ( x )- g -( x ). 对于 W ： r ) 的 
斯蒂尔切斯积分,可由下式定义 



g ( x ) dF { x ) 


g + ( x ) dF { x ) - / g ~( x ) dF ( x ) 


当 X ! Ls + ⑷ 狀⑷和 SZo9 ~^) dF ( x ) 不都为 +oo 时， fZo9 ( x ) dF ( x ) 有定义，此 
时称； SZc 9^ Wx ) 存在. 

若 X 为任意随机变量，其分布函数为则 X 的期望由下式定义 
E [ X ) = f idF ( i ) 


(9.1) 
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可以证明，当 X 为离散随机变量时， 

f xdF ( x ) = xp ( x ) 

X ： p(x)>0 

其中 pOe ) 为 X 的分布列.当 X 为连续时 

f xdF ( x ) = f xf ( x)dx 
J — OO J —CO 

其中 / Or ) 为 A " 的密度函数. 

读者应该明白 （9.1) 式的直观含义.考虑近似和 

- Fixi.x)] 

i=l 

将 X 的近似值 A 乘以 X 落入区间 (Xi-uXi) 的概率，再将这些乘积加起来，就是 
X 的期望的近似值.当这些分割区间的长度越来越小时，就得到 X 的期望值. 

利用斯蒂尔切斯积分可以将期望的定义变得简洁，它抓住了期望这个概念的本 
质.例如，斯蒂尔切斯积分可以将离散和连续的两种情形统一起来.在教材中也不 
必分离散和连续两种情形给出定理的证明.斯蒂尔切斯积分的性质也与通常积分 
性质相同.本章中所有性质都能推广到一般情况. 


小 结 


设具有联合分布列 P (： C , y ), 则 


E [ g ( X , Y )] = ^2^2 g { x , y ) p (. x , y ) 

V x 

若它们具有联合密度 /( Z , J /), 则 

E [ ff ( X , y )] = f f g ( x , y ) f ( x , y)dxdy 

J —OO J —OO 

若令 g ( x , y ) = x + y , 可得 


E[X + Y ] = £[ X ] + E [ Y ] 

这个公式可推广到 n „ 

i=l i=l 

X , Y 的协方差由下式 定义： 

Cov ( X , y ) = E [( X - E [ X])(Y - E [ Y ])] = E [ XY ) - E [ X ] E [ Y ] 
下面的恒等式十分 有用： 

= EE Cov ( Xi >^) 



当 n = m,Xi = Yi,i = 1,2, ■■- ,n B ' t , 

Var ( 史不) = 史 Var(D + 2^^ °^( 不 ， D 

V «=1 i=X i<j 

X,Y 之相关系数 p(X,Y) 由下式 定义： 

P(X,Y) = 


Cov(X，Y) 


y / Vax ( X ) Var ( Y ) 

若 X，y 为二元离散随机变童，则在 Y = y 的条件下, A " 的条件期望由下式 给出： 


E[X\Y = y} = ^ xP{X = i|y = y } 

如果是二元连续的，则 

E[X\Y = y] = J xfx\v(,x\y)dx 


其中 


fx\v{x\y) 


f(x,y) 

fv(y) 


为 y = y 条件下 X 的条件密度.条件期望的性质与通常期望的性质是类似的，只 
是在计算中，所有概率都是 Y = y 之下的条件概率 • 

记 E[X\Y] 表示 y 的函数，当 y = 1 /时，其值为 E[X\Y = y \. 关于条件期望的 
—个重要的恒等式为 

= E[E[X\Y\] 


在离散情形下，是 

E[x\ = Y, E [ x \ Y = y) p { Y = y} 

v 

连续情形下，是 

E[X) = J E\X\Y = y]fy{y)dy 

上述的公式可以用来计算 E[X}. 其方法是先固定 Y = y, 求出条件期望 E[X\Y = y], 
再对 y 求 期望. 此外，对于每一个事件人 P ( A ) = E[ I a ), 其中以是事件 A 的示 
性函数.我们也可以利用上述关于期望的计算公式来计算 P(A). 

X 在 y = y 之下的条件方差由下式 定义： 

Var(X|y = y) = E[{X - E[X\Y = y)) 2 \Y = y) 

记 Var(X|y) 表示 y 的函数，在 y = y 处， Var(X|y) 的值是 Var(X|y = y ). 下面 
的公式称为条件方差 公式： 

Var(X) = E[Var(X|y)] + Var(£ ； [A-|r]) 

设我们可观察到随机变量 X 的值，我们希望根据 X 的观察值，预测随机变量 K 的 
值，在这种情况下， E[Y\X] 是使均方误差达最小的预测值- 
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随机变量 X 的矩母函数由下式 定义： 

M(t) = E [ e tx ] 

X 的各阶矩都可以从 M(t) 的各阶微商在 f = 0处的值得到.特别地， 

矩母函数的两个重要性 质是： 

0) 随机变量的矩母函数唯一地确定它的 分布； 

( ii ) 独立随机变量和的矩母函数等于各随机变童的矩母函数的乘积. 

这个结果可使下列结果的证明 简化： 独立正态（泊松或 r ) 随机变量的和的分布仍 
然为正态（泊松或 r ) 分布. 

若； Xm 均为有限个相互独立的标准正态随机变量的线性组合，则称 
X u ...，X m 为联合 正态. 其联合分布由= 1,…， m 所 
确定. 

设…，为独立同分布的正态随机变量序列，期望为/ X , 方差为 ( T 2 , 则其 
样本均值 „ 

和样本方差 „ 

s! = ^iLw-^ 2 

相互独立.样本均值 X 是正态随机变最期望为 M , 方差为 a 2 / n ； ( n - l ) S 2 Ar 2 是 
X 2 随机变量，自由度为 n -1. 


习 题 

1. 一个玩游戏者同时掷-枚均匀骰子和扔-•枚均匀硬币.如果硬币正面朝上,他贏得骰子出 
现点数的两倍，否则贏得骰子点数的1/2,求他贏得的期望. 

2. 一种名为 Clue 的牌戏是这样的，•副牌中含三种牌.第 种牌 上画有不同的嫌疑者，一 
共6张；第二种牌上画有不同的武器，也有6 张； 第二种牌上0有不同的房间，有9张. 
每种牌内抽取一张，游戏的目的是要猜出被抽出的3张牌. 

( a ) -共有多少“副”可能的牌？（抽出的3张称为丨副）在一种游戏中，当3张牌被选中 
以后，每个游戏者又从剩下的牌中随机地抽取3张.设某个游戏者抽到的3张牌中， 
有 S 张嫌疑者，有撕张武器，有/?张房间，又令 X 表示当该游戏者观察到自己的 
3张牌以后，最早被抽出的那3张牌的可能“副”数. 

( b ) 找出 X 与 S , 的 关系. （ c ) 计算 E [ X ). 

3. 一个游戏由一局一局组成,各局的结果都是相互独立的.每局中游戏的双方以相同的概率 
贏或输一个单位.记撕表示某玩家的净贏的局数.设某玩家的策略是这 样的： 当他第 •- 
次贏一个单位以后立即停止游戏•求 （ a ) P{W > 0}, ( b ) P{W < 0}, ( c ) E \ W ). 



4. 设 x ， y 的联合密度出现 如下: 


/ x , v ( x , y )=| J /W, 


0 < y < 1, 0 < x < y 

其他 


求⑷ E [ XY ], ( b ) E [ X ], ( c ) E [ Y ). 

5. 县医院位于边长三英里的一个正方形的中心.当发生事故时，医院就派出救护车.设医院 
位于 （0,0), 发生亊故地点为 ( X , Y ). 由于路网是格子形的，由 （0,0) 到 ( x , y ) 所需走的 
路程为 | x | + | i /|. 假定亊故是均匀地发生于这个三英里边长的正方形内，求每次发生事故 
时，救护车为到达出事地点所走的平均路程. 

6. 某人掷骰子10次,计算所得点数之和的期望值. 

7. A 、 B 两人随机地，独立地从10个不同的物件中选出3件，求下列随机变量的期望. 

( a ) 两人同时选中的 件数. （ b ) A 和 B 均不选中的件数 .（ c ) A , B 两人中只有一人选中 
的件数. 

8. 设有 JV 个人参加某晚宴， 当一个 人到达以后，若他发现已到达的客人中有他的朋友，则他 
坐在有朋友的•桌上，否则，他就新开•桌,假设这对中，每一对都以概率 p 成为朋 
友，并且各对之间是否成为朋友是相互独立的.求出当晚开桌数的期望值. 

檯示 ：记； = 1表示第 i 个到达者新开一桌，= 0表示第 i 个到达者与朋友坐在 
一桌.（假定桌子都是很大的，可以同时坐个人 

9. -共有 n 个球，标号 1,2, ■ , n . 还有 n 个坛子，也标号1,2, •••,«. 假设球 i 等可能地 
被放进坛子1,2,…， i 中， i = 1,2,…， n •求 

( a ) 空坛子的期 望数； （ b ) 每个坛子都不空的槪率. 

10. 进行3次试验，每次都有相同的成功概率,记 X 为3次试验中成功的次数.若 E [ X ] = 1.8. 
( a ) P{X = 3} 的最大可能值是什么？ （ b ) P{X = 3} 的最小町能值是什么？ 

对每种情况构造一个概率棋型，使得 P{X = 3} 取得指定的值. 

提示： 对于 （ b ), 令 U 为 (0,1) 上的均匀随机变量，然后，根据 t / 的值定义试验. 

11. 考虑 n 次独立掷硬币试验，设每次正面朝上的概率为 p . 我们称一个改变发生，如果这一 
次出现的试验结果与上一次试验的结果 不同. 例如，当 n = 5时，试验结果为 HHTHT , 
其中 H 表示正面朝上，这个试验结果中现了 3个改变.求出 n 次试验中改变数的期 
望值. 

提示： 可将改变数表示为 n - 1个伯努利随机变量的和. 

12. n 个男生和 n 个女生随机地排成一队. 

( a ) 求在队伍中后面跟着一个女生的男生数的期望值 ■ 

( b ) 假定这些学生是随机地坐在一张圆桌边，求右边坐着一位女生的男生数的期望值. 

13. 有1000张卡片，上面写上编号1 〜 1000. 随机地分送给1000人，计算卡片编号与人的 
年龄相符的卡片数的期望值. 

14. 一个坛子内有 m 个黑球，每次从坛子内拿走一个黑球并加进一个新球，这个新球以概率 
p 为黑球，以概率1 - p 为白球.继续这样试验一直到拿光所有的黑球为止，求期望试验 
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次数. 

注： 这个棋型对于理解艾滋病有帮助.在人类免疫系统中有一类细胞称为 T 细胞.一共 
有两种类型的 T 细胞， CD 4 和 CD 8. 在患病初期，病人的细胞中的细胞比例与健康人 
的比例是相同的，约为60%和40% ,但是病人的细胞中的 CD 4 比例一直在缩小.现在 
的模型是这样的，病毒入侵以后，攻击 T 细胞,但是身体补给系统并不区分损失的细胞是 
CD 4 还是 CD 8, 它以 0.6 比 0.4 的比例补给.当身体健康的时候，这个补给比例是合适 
的，由于 HIV 病毒只攻击 CD 4 细胞，这种补给方式就非常危险，正如本题棋型一样，黑 
球终有一天被取光. 

15. 在例 2 h 中，称 i 和 j 形成一个 E 对，如果 i 拿了 j 的帽子，而 j ♦了 i 的帽子，求配对 
数的期望值. 

16. 设 Z 为标准正态随机变量，对固定的 a :, 令 

( Z Z>x 
0其他 


证明： £( X ] = -^ e - a/a . 

17. 设有 n 张牌，标以1,2,… ， n . 随机地排 次 序，现在让你顺次地对 n 张牌作 n 次猜测， 
记 N 为正确猜测数. 

( a ) 若每次猜测时，都没有以前猜测的信息，则对任何猜测方案均有 E [ N ] = 1. 

( b ) 若在每次猜测以后，都会告诉你被猜测的牌的号码.什么是最好的猜测策略？指出在 
此策略之下，有 



( c ) 现在假定每次猜测以后都只告诉你对或错,在这样的情况下下面的策略使达到 
最大值.凡是告诉你错，就坚持原来的猜测，直到猜对为止,然后再换一个猜下一张卡 
片.对于这个策略指出 

£[AT] = 1 + 去 + 六 + ." + 去 * e— 1 

提示： 对于所有三个问题，将 W 表示成示性随机变量（也即，伯努利随机变量）的和. 

18. 一共有52张的扑克牌的翻牌游戏，每次翻一张，直到全部翻完为止.若第一张翻得 “ A ”， 
或第二张得2,或……，或第13张得 “ K ” ，或第14张得 “ A ” ，等等，我们就称出现一个 
配对，求出现的配对数的期望.注意在翻牌游戏中不分花色，如在第 (13 n + l ) 次翻牌中, 
只要是 A (不管什么 A 的花色)，都算一个配对. 

19. 某一地区一共有 r 种昆虫，捕足昆虫时,每次捕捉到的昆虫种类与前面的每次捕捉都是相 
互独立的.现设每次捉昆虫时，捉到第 i 种昆虫的概率为 Pi .^1,2, - - , r ， Et = iP < = l - 

( a ) 指出第一次捉到种类为1的昆虫时，所捉到的昆虫数的期望值. 

( b ) 指出第一次捉到种类为1的昆虫时，所捉到昆虫种类的期望值 • 

注： 记7•种昆虫的种类分别为1,…， r . 




20. —个坛子内有 n 个球，第 i 个球的重量为 W ( t),i = 1,2,- • ,n. 从坛子中无放回地取 
出球，且每个球被取到的概率为其重量占剩下的球的总重量的比例.例如，若坛中的球为 
*!,••• ,ir, 则球 h 被抽到的概率为 W ( ii )/ J ： l = l W { i k ),j = 1,2,••- ,r. 计算在抽到1 
号球以前所抽球的个数的期望值. 

21. 设有100人组成的集体，计算 

(a) 一年中刚好有3个人在同一天生 H 的天数的期望值； 

(b) 100人中不同生日的天数的期望值. 

22. 掷一枚均匀敗子，求出全部6个点数至少出现一次所需掷骰子的次数的期望值 • 

23. 1号坛子含5个白球6个黑球，2号坛子含8白，10黑.从1号坛子随机地取出两个 
球放入2号坛子，然后再从2号坛子随机地取出3个球，计算这3个球中白球数的期 
里值. 

提示： 令；^ = 1,如果1号坛子内的第 i 号白球是最后选出的3个球中的一个， X* = 0, 
其他情况.令 K = 1,如果2号坛子内第 i 号白球是最后选出的3个球中的-•个, K = 0, 
其他情况.则最后选出的3个球中白球的个数为 E?-, Xi + E!-, Vi- 

24. —个瓶中含有两种药片，大的 m 片，小的 n 片.每天，病人随机地从中选 一 片，如果选到 
小的，就吃下去，如果选到的是大的，就掰成两半，吃掉一半，剩下一半成为小药片，放进 
瓶内. 

(a) 令； C 表示拿到最后一片大的药片并且将吃剩的半片放回瓶中以后，瓶子内剩下的小 
药片的数目，求机 Y1. 

提示： 定义 n + m 个示性随机变量，一类是原来 n 个小药片，另一类是 m 个大药片 
吃掉一半以后成为的小药片，再利用，例 2m 中的方法. 

(b) 记 y 表示病人拿到最后一片大药片的天数，求 E [ Y ]. 

提示： x 与 y 之间有什么关系？ 

25. 设 Xi,X 2 , ••-是独立同分布的连续随机变童序列，记 N > 2 满足； Cx 彡彡 …彡 
Xjv-i < Xw, 即 N 是这个序列开始上升的 时刻. 证明 J5[N] = e. 

提示： 首先计算 P{N ^ n}. 

26. 设 X x ,X a , • ■ - , X n 为独立同分布并在 (0,1) 上均匀分布的随机变貴序列，计算 
(a) £[max(Xi ，…， X n )]; (b) £[min(Xi ，…， Xn)]. 

*27. 一共有 101 个物品放入 10 个 ft 子，显然至少有-个盒子包含多于10个物品，用概率方 
法证明此结果. 

•28. 设一个由 n 个元件组成的系统，这 n 个元件样成一个 圆周. 每一个元件有两种状态，失效 
和工作.若这个 n 个元件组成的系统中，不存在连续 r 个元件，其中至少有 fc 个失效，则 
这个系统正常运行，这种系统称为圆周的 （fc,r,r») 可靠性系统， k ^ rKn . 现在共有47 
个元件，其中8个失效，指出不可能安排出一个正常运行的 (3,12,47) 圆周系统. 

*29. 一共有四种不同的优惠券，前两种优惠券组成一组，后两种优惠券组成另一组（例如前两 
种为食品优惠券，后两种为服装优惠券 .） 每得到一个新的优惠券，它是第 i 种的概率为 
p«, i = 1,2,3,4•其中 pi =P2 = 1/8, ps = p 4 = 3/8 . 记 X 为达到下列目的之一所需收 
集的优惠券数，并求 £[X]. 
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( a ) 所有4种优 惠券： ( b ) 第一组中所有的各种优 惠券； 

( c ) 第二组中所有的各种的优 惠券； ( d ) 第一组或第二组中所有各种的优惠券. 

30. 设；为独立同分布的随机变量，其公共期望为队方差为 < r a . 求 E[(X - Y ) 3 ]. 

31. 计算习题6中点数之和的方差. 

32. 在习题9中，计算空坛子数的方差. 

33. 设 E [ X ] = 1, Var ( X ) = 5,求 （ a ) £((2 + X ) 2 ]; ( b ) Var (4 + 3 X ). 

34. 10 对夫妇随机地坐在一张圆桌上，记 X 为夫妇坐在相邻位置的对数，求 
⑷ E [ X \. ( b ) Var ( X ). 

35. 一副扑克牌，•张一张翻开，分别计算为出现下列牌所需翻牌数的期望值. 

( a ) 两个 “ A ” ： ( b )5 个 黑桃； ( c ) 13张红桃 • 

30. M •枚均 匀殺子 n 次，记 X 和 y 分别是出现1点和2点的次数，计算 Cov ( X , Y ). 

37. 掷一枚均匀败子两次，记 X 为两次出现的点败之和，记 Y 为第一次出现的点数减去第二 
次出现的点数的差，计算 Cov ( x . y ). 

38. 设 X ， V •具有联合密度函数 

、 [2 e -2 */* 0 ^ * < oo ,0 < y < I 

f ( x , y ) = < 

[0 其他 


计算 Cov ( x , y ). 

39. 设 X U X 2 , …为独立同分布随机变量序列，其公共期望为公共方差为记 K = 
X n + ^ fn +1 + Xn +2， 求 CovJVi ,, 1^,+ j ), j ^ 0. 

40. 设；的联合密度为 

f { x , y ) = l e ~^ +x/v) x >0, y >0 


求 £[ Xl ,£![ y ], 并证明 Cov ( X , y ) = l . 

41. 鱼池中共有100条鱼，其中30条为鲤鱼，现抓住20条，求这20条中鲤鱼数的期望与方 
差.计算时，你作了什么样的悝定？ 

42. 由20人组成的集体,其中10人为男生，10人为女生.他们随机地分成10组，每组2人, 
求10组中男女混合的组数的期望与方差•若20人由10对夫妻组成，问分姐中夫妻组的 


组数的期望和方差. 

43.设 X u …， X n 为独立同分布的随机变量序列，其公共分布函数为未知的连续函数 F { x ). 
又设 Y u - - , Y m 也是独立同分布的随机变量序列，其公共分布函数为未知的连续函数 
G { y ). 现将这 n + m 个变童排序，令 


jl 若 r » + m 个值中第 i 个最小的值来自 X 
難 


r = 称为样本入的秩和，它是检验 f 与 g 是否相同的标准统 计量. （这种检验 
称为威尔科克森 ( Wilcoxon ) 秩和检验)，当/?不是很大也不是很小时，接受假设 F = G . 
现在在 F = G 的假定下，计算 K 的期望和方差. 


提示： 利用例 3 e 的结果. 
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44. 有两种生产工艺生产某种产品，由工艺 i 生产的产品的质童的分布为连续分布 ^,* = 1,2. 
现设利用工艺1生产 r » 件产品，工艺2生产 m 件产品，令 


fl 若第）个最好产品来自于工艺1 
^2難 


Xu ■■- , X n+ m 中有 n 个1, m 个 2_ 记 fl 表示 “1” 的游程的个数，例如， n = 5,m = 
2, X = 1,2,1,1,1,1,2, 则= 2 .在只=巧的假定之下， R 的期望和方差是什么？（如 
果两种工艺生产的产品质量完全一致，则 R =凡.） 

45. 设 X U X 2 ,X 3 ,X 4 是两两不相关的随机变量序列，具有均值0和方差 1. 计算下列各对 
随机变量的相关系数： （ a ) 不+ X a 和； f 2 + X 3; ( b ) A + X 2 和 X 3 + X 4 . 

46. 在赌场中有这样的 游戏： 赌徒 1 和赌徒 2 先轮流掷两枚殽子,然后庄家也掷两枚骰子.若 
赌徒 i 的点数和严格地大于庄家的点数和，则赌徒 i 贏，令 



若赌徒 i 贏 
若赌徒 i 输 


指出 Iuh 为正相关的，解释这个结果的原因. 


47. 考虑有 n 个节点1,2,…， n 的一个图，假设对节点中的每一对节点独立地以概率 p 
连上一条边而相互联结.对于每一个节点 i , 它所联结的点的个数称为该点的阶. 


( a ) Di 的分布是什么？ （ b ) 计算相关系数 piDi . Dj ). 

48. 连续地掷一枚均匀«子，记 X 和 y 分别为得到6点和5点所需掷的次数，求 


( a ) E [ X ], ( b ) E [ X\Y = 1], ( c ) E [ X\Y = 5]. 

49. 在一个盒子里有两枚不均匀的硬币，在抛掷硬币时正面朝上的概率分别为 0.4 和 0.7 .现 
在从中随机地取一枚硬币，连续抛掷10次.已知前3次抛掷硬币时，有2次正面朝上, 
问10次抛掷后，正面朝上的次数的条件期望是多少？ 
so. 设的联合密度为 


/(*, V ) =--- 0< i < oo ,0 <! /<00 

计算 B[X 2 \Y = y\. 

51. X,Y 的联合密度为 

e _* 

/(*,!/)= 0 <x < y,0 <y < oo 

计算 E[Y 3 \Y = y], 

52. 设一个班由 r 个不相交的小组组成，记为第 i 个小组占班上总人数的比例 ， i = 

l ,2,- -, r . 若第 < 个小组的成员的平均体重为 w it i = , r . 问全班成员的平均 

体重是多少？ 

53. 一囚犯发现三个暗道，从第一个道出去经过2天会回到原地，从第二个暗道出去经过4天 
会回到原地，从第三个暗道经过一天会走出监狱.假定该犯人总是按 0.5, 0.3 和 0.2 的概 
率选择暗道，问他逃出监狱所需的平均天数. 
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54. 考虑-个掷敗子游戏，每次掷一对骰子，如果点数和为7游戏结束，贏得为 0. 如果点数 
和不是7,那么可作两种选择，你可以将点数和作为贏得而停止游戏，或者重新开始游戏. 
对每一个 i,i = 2,…，12,可以制定一个游戏策略，当掷得点数和不等于7,但这个数小于 
i 时，选择重新开始游戏.只有当点数和> i 时才停止游戏，求此时的期望贏得 . i 为何值 
时，能获得最大的期望贏得？ 

提 示：记 Xi 为采用策略 i 时的贏得.将首次掷教子所得的点数和作为条件，求 X ,的条 
件期望. 

55. 10个猎人在等着野 W 飞过天空，当野鸭飞过时，猎人们随机地选中一个目标，同时射击. 
假定猎人们随机地选择目标，且他们之间相互独立，各自以 0.6 的概率击中目标，又假定 
飞过的 野鹌数 的分布为泊松分布，其参数为 A = 6. 求被击中的鸭子数目的期望值.（泊松 
随机变量取0值的情况不予考虑 .） 

56. 设某大楼共有 W 层，在1层有 n 个人进入电梯， n 是泊松随机变量,其分布参数为 A = 10. 
设对于毎一个人，其目的地是相互独立的，并且是等可能地进入每一楼层.求该电梯在2 
层以上平均停多少次才能将乘客送到他们各自的楼层. 

57. 设某工厂每周平均发生5次亊故，在每次亊故中受伤的平均人数为 2.5. 并且假设各次亊 
故中受伤人数是相互独立的，计算一周内受伤的工人败的期望值. 

58. 设抛掷硬币时，正面朝上的概率为 P , 不断地抛捭硬币，直到正面和反面都转出现为止 • 
求： （ a ) 抛掷硬币次数的期望； （ b ) ft 后一次出现正面朝上的概率. 

59. —共有 n + 1个人参加游戏，每个人以槪率 p 取胜，且各人的输贏是相互独立的，所有胜 
者均分一个单位的奖金（例如，若有4个人贏,则每个人得到 I / 4 ，如果没有人贏,则无人 
得奖).设 A 为某参加者， X ■代表 A 所得的奖励. 

( a ) 计算游戏者所获得的总奖励的期里值. （ b ) 指出 E [ X ) = [1 - (1 - p ) n +1 ]/( n + l ). 
( c ) 以 A 是否贏作为条件，计算 E [ X ]. 并证明 


sid + s)- 1 ] 


l -( l - p )" +, 

(n + 1)P 


其中丑为二项随机变量，其参数为 ( n , p ). 

60. m + 2 个人玩游戏，每一个人拿出一元钱放在―起以便开始游戏.连续抛掷一枚均匀硬币 
r » 次，其中 n 为奇数，并记录每次抛掷结果.在抛掷硬币之前，参加游戏的每一个人，^ 
须写下一个他对每次抛掷结果的猜测，例如，当 n = 3时，游戏参加者写下 （ HHT ) 表示 
他预测第一次会出现正面朝上，第二次正面朝上，第二次出现反面朝上 ■ 当真正的 n 次抛 
掷结果出来以后，每个人核对 n 次抛掷结果和他的猜测结果，计算他正确猜测的次数.例 
如，若实际抛掷结果为 ( HHH ) 而他的猜测为 ( HHT ), 此时，他正确猜测数为 2. 作为对 
猜渕者的奖励，将 m + 2元钱平均分配给那些正确猜测数最多的人.由于抛掷一个硬币 
出现 H 或 T 的概率是相同的，而各次抛掷又相互独立，因此其中 m 个参加者决定随机 
地预测，特别地，他们在亊先可以自己抛掷一枚硬币》次，将所得的结果作为猜测.然而， 
另外两个人决定合伙，其中一个人与前面 m 个人的做法完全_样，另一个人预测刚好其 
合伙人相反的结果.例如，若一个人预测为 ( HHT ), 则另一个人的预测为 ( TTH ). 

( a ) 指出两个合伙人中至少有一个人的正确猜测数大于 «/2( n 为奇数). 
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< b ) 记； f 为不参加合伙的 m 个人中正确猜测数超过 n /2 的人数 . JC 的分布是什么？ 
(C) 设 X 如 （ b ) 中所定义，指出 

£[合伙人所得钱数 j = ^+2)£；[^1-^] 

⑷利用习题 59( c ), 指出 

啦伙人 所得钱数卜2^ [卜⑷ " +, ] 

并具体计算当 m == 1,2,3时的值.由于可以证明 



这说明合伙策略可以得到更多的期望收入. 

61. 设； 为独立同分布随机变童，其公共分布为设 iV 为与它们独立的随机变 
M , 具有几何分布，参数为 p ， 令 Af = max ( Xi , …， X N ) 

( a ) 求 P { M < z } (以 N 作为条件，利用条件期望进行计算)； （ b ) 求 P { M ^ x\N = l }, 
( c ) 求 P{M < x\N > 1}； ( d ) 利用 （ b ), ( c ) 再导出 （ a >. 

62 . 令 U u lh , … 为一独立同分布的随机变最序列，其公共分布为 (0,1) 上均分布.在例 5 i 
中我们己经指出对于0 < I < 1, E 【7 V ( o 01 = e 1 ， 其中 

N ( x ) = min {n : Ui > i |. 

此处给出这一结论的另一证法 

( a ) 利用对 n 归纳法，指出对 0< a :< l 和一切 n 彡0 

P { JV ( i)^n + l } = ^- 

提示： 首先以为条件，然后利用归纳假设. 

( b ) 利用 （ a ) 证明 E [ N ( x )] = e *. 

63. —个坛子里含30个球，其中10个红球，8个蓝球，从坛子里随机地取出12个球，记 X 
为红球数， y 为蓝球数，求 cov ( x . y ). 

( a ) 定义适当的示性（也即伯努利）随机变鼇 X it Yi , 使得 A " = E *=, Xi,Y = I ：、 iO . 

( b ) 利用条件期望的方法求 E [ XY \. (以 A " = * 作为条件或以 Y = y 作为条件 .） 

64. 设某箱子有两种灯泡，第 i 种灯炮的寿命的均值为糾，标准差 为内 , i = 1,2. 现从箱中随 
机地抽取一灯炮，抽到第1种的概率为 P , 抽到第2种的概率为1 - p . 记抽出的灯泡寿 
命为 X ，求⑷ E [ X ]-, ( b ) Var ( X ). 

65. 已知气候良好时一年冬季风暴次数是均值为3的泊松随机变量，而气候恶劣的年头冬季 
风暴个数的是均值为5的泊松随机变置.若下一个年头气候好的概率为 0.4, 不好的概率 
为 0 . 6 . 求出下一个冬季的风暴数的期望值和方差. 

86. 在例 5 c 中，计算矿工到达安全地点所需时间的方差. 
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07. 设有一赌徒，他在每次赌博中，贏和输的槪率分别为 p 和1 - p •当 p > 1/2时，有一种 
Kelly 策略，就是总用现有财产的 2 p - 1倍作赌注.试计算从他的初始财产 i 算起,利用 
Kelly 策略，经过 n 次赌博以后的期望财产. 

68. —个人在一年中事故的次数为泊松随机变童，参数为 A ， 但是亊故的发生次数随人而变. 
设人群中有60%的人的参数为 A = 2,另有40%的人的参数为 A = 3. 现从中随机地找 
一人，他在一年中 （ a ) 有0个事故 （ b ) 有3个事故的概率是多少？若己知他上一年没有 
事故，下一年有3个亊故的概率有多大？ 

69. 在习题68中，设参数 A 本身为 一 随机变貴，人群中参数 A < x 的比例为 1- e —, 重复 
该问题的计算. 

70. 设一坛子中有很多硬币，假定抛掷硬币时正面朝上的概率为 P , 而 P 的值与拿到的硬币有 
关.由于从坛子中随机地取--硬币， P 也可以看成随机变量，并且假定 P 的值在[0,1】上 
均匀分布.现在从坛子中随机地取一硬币，连续抛掷两次，计算下列亊件的 概率： 

( a ) 第一次抛裤正面 期上； （ b ) 两次均为正面朝上. 

71. 假定在习题70中，抛掷硬币 ri 次.记 X 为正面朝上出现的次败•证明 

/>{久=*} = ^^ » = 0,1, - ,n 

提示，利用公式 

J 0 X {1 ~ X) dx ~ (a + 6~ l )! 

其中 a , 6 为正整数. 

72. 设在问题 70 中，随机的取出一枚硬币，并连续抛掷，直到出现正面朝上为止.记 W 为抛 
掷次数，计算 （ a ) P{N >»}, i >0;( b ) P{N = i }; ( c ) E [ N ]. 

73. 在例 6 b 中，令 S 代表发送的倌号， fl 代表接收的信号. 

⑷计算 ( b ) 计算 Var ( X ). ( c ) fl 是否为正态随机变量？⑷计算 Cov ( fl , S ). 

74. 在例 6 c 中，假定 X 的分布为 (0,1) 上均匀 分布. 并假定 （0,1) 区间的离散化由 a 0 = 
0 ,oi = l /2, a 3 = l 所确定.找出最优的离散化随机变量 A 并计算相应的 E [{ X - Yn 

75. 设 X 和 V 的矩母函数分别为 AMt ) = exp {2 e * - 2} 和 My ( i ) = ( fe * + i ) 10 . 若； f 和 
Y 相互独立，计算 （ a ) P{X+y = 2>; ( b ) P{XY = 0}; ( c ) E [ XY }1 

76. 设某人掷两次骰子，记久为第一次得到的点数， y 为两次的点数之和.计算 X 和 y 的 
联合矩母函数. 

77. 设；的联合密度为 

0 < y < oo , 一 oo < I < oo 

( a ) 计算；的联合矩母函数. （ b ) 分别计算 A •和 y 的矩母函数. 

78. 两个信封里各有一张支票.你随便打开—个信封，看到了支票上的钱数.此时，你可以有 
两种选择，或者接受这张支票，或者接受另一个信封内的支票，你该怎么办？是否可以找 
到一种办法，比接受第一张支票更好？ 

记义 B 为两张指标的面值, A < B , 若随机地选一张并接受它，你的期望收入为 { A + B )/2. 
考虑下面的第二种策 略：令 F (: r ) 为严格上升并且连续的分布函数，设第一张支栗的面值 
为 a :, 然后以 F (: r ) 的概率接受，以1 - F { x ) 的概率改变为接受另一张支栗. 



( a ) 证明，如果使用第二种策略，其期望收入将大于 (A + B )/2. 

提示： 以第一张支票的面值为4或 B 作为条件. 

现在考虑另一个 *- 策略，其中 a : 为固定的值，若第一张支栗的面值 大于: c , 则接受, 
否则接受另一个信封的支票. 

( b ) 证明，对于任何 : c 值，在 * 一 策略之下，你所得到的期望收入至少是 （4 + S )/2 ,特 
别地， 当: r 在辜丑之间的时候，你所得到的期望面值大于 (A + B )/2. 

( c ) 记； f 为 (- 00 , 00 ) 上的连续随机变童，且< X < B } > 0. 考虑如下的 策略： 
产生一个 X 的值 a :, 然后利用 （ b ) 中的； r - 策略，证明你所得到的期望收入大于 
(A + B )/2. 

79. 设为连续的两个星期的销售量（以1000元为单位)，已知 ( X , Y ) 具有二元正态分 
布，其公共期望40,公共标准差为6,相关系数为 0.6. 

( a ) 求出两星期总销售额超过90的概率. 

( b ) 若相关系数由 0.6 减为 0.2, 你认为 （ a ) 中的概率会增加还是减少？说明你的理由. 

( c ) 相关系数为 0.2 时重复 （ a ) 的计算. 

理论习题 

1. 证明 E[(X - o ) a ] 在 a = E [ X ] 时达到最小 • 

2 •设 X 为连续随机变量，密度函数为/,证明 E[\X - a |] 在 a 等于 F 的中位数时达到最 
小值 • 

提示： 注意 

抑太 - a |] = y |i - o |/( x)dx 
将积分区域分为两部分 * < a 和 a ; > a , 然后求微商. 

3. 在下列情况下证明命题 2.1: 

( a ) ( X , y ) 具有联合分 布列； 

( b ) ( X , y ) 具有联合概率密度并且函数 g ( x , v )>0 对一切成立. 

4. 设具有有限期望 p 和方差 a 2 , 记9 ㈠ 为二次可微函数，证明 

E \ g ( X )] « g ( n ) + 

提 示：将 ㈠ 在//处展开，利用前三项，忽略余项. 

5. 设 A U A 2, ■■- , A n 为任意亊件， 定 XC k = {先中至少 fc 个亊件发生证明 

提示： 记 A ■为 yli 中发生的亊件数，指出等式两边均为 E [ X ]. 

6. 注意到，在文中有等式 ^ ^ 

e [E 不] = 

其中为非负随机变童，由于积分 k 和的极我们希望下式 
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E \ J : X ( t ) di ] =厂 £[ X ( i)]dt 

对所有非负随机变量 X { t ),0 <00 成立.此式确实成立，利用此结论给出 

E [ X ]= P{X > t}dt 


的另一证明（其中 X 为非负随机变童） 

提示： 对一切 t > 0,定义 

X { t ) 

然后利用公式 X = /f X ( t ) dt . 
r . x 称为随机地大于 y (记作 x >« n 如果对所有有下式成立 


[1 t<X 
[0 t> X 


P{X >t}> P{Y > t) 

指出在下列两种情况下，若久則 e \ x \^ B[y]. 

(a) X , Y 为非负随机变 ft. (b) X , Y 为任意随机变量 • 

提 示：记 

x = x + - X ^ 

其中 

x^{ x x>0 

[0 X<0 

类似地，将 y 写成 y + - y-， 然后利用 （a). 

8. 指 出；： 成立的充要条件是下式 

E\fW] > E[f(Y)] 

对所有增函数/成立. 

提示： 由； t 推导 E [ f ( x )] > £[/(y)], 只需指出 f ( x ) >«/(y) 然后利用理论习 

题7,证明逆命题只需定义适当的增函数 /. 

9. 设有- .硬币，在抛掷时正面朝上的概率为 P. 现在抛掷 n 次,计算正面朝上的游程的长度 

为 fc 的个数的期望值，1 < < n. 

10. 设 XuXv , X „ 为独立同分布的正随机变童，计算 

k^n 

11. 考虑 n 次独立重复试验,每次试验可有 r 个不同的结果，其相应的概率为 A, Pi , - , Pr - 
记X表示在 n 次试验中从未出现的结果的个数，计算 BW， 并且指出在 Pi , P2 , -,Pr 
的所有可能取值中，当只= l/r,i = 1,…，》•时， E [ X ] 达到极小值. 

12. 设，…为独立同分布随机变量序列，久》的分布列为 

P { X n = Q ) = P{Xn = i ) = \, n^l 
随机变量X = x "/ 3 " 的分布称为康托分布.求迟岡和 Var(X). 


10 X^O 
1-x X<0 
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13. 设 Ai , …，为独立同分布的连续随机变童序列，我们称在;/时打破记录，若 Xj > X ‘， 
对一切 成立.证明： 

⑷ E [打破记录数 •: ( b ) Var (打破记录数 

14. 在例 2 i 中，记 X 为集齐一套优惠券所需收集的优惠券张数.证明 

Var ( X ) = g 

当 N 充分大时，这个数近似于 iV a Ji a /6( 即 Var ( X )/( JVV /6) -» l , JV - oo ). 

15. 设有 n 次独立试验，第 i 次成功的概率为 iV 

( a ) 计算成功次数的期望值，并记为 /*• 

( b ) 对固定的 M 值,选择 Pu - , Pn 的值使成功次数的方差达极大_ 

(C) 什么样的选择使方差达极小？ 

•16. 设5 = {1,2,… ， n } 为一个集合，集合中的任一元索可以被涂成红色或蓝色.又设山,…， A r 
为5的 r * 个 子集. 指出，存在一种涂颜色的方法，使得 A u - - , A r 中具有相同颜色元索 
的子集数不会超过 EUU / 2 ) 1 心 1_1 ,其中⑷表示集合 A 中元索的个数. 

17. 设 X lt X, 相互独立，具有公共的期望值 M •设 Var ( Xi ) = a ?, Var ( Xa ) = ^,由于 /i 未 
知，我们希望以 X U X, 的加权平均作为 M 的估计，即以 AXi + (1 - X)X2 作为 M 的估 
计.什么样的 A 值使估计的方差达最小？解释所得结果的合理性. 

18. 在例 4 f 中，我们在求多项随机变量风和％的协方差 {- mPiPj ) 时,将况和恥表示 
成示性随机变量之和.这个结果也可从下式 得到： 


Var ( N < + Nj ) = Vai ( Ni ) + Var (的） + 2 Cov ( M ^) 

( a ) Nt + Nj 的分布是什么？ （ b ) 利用上面的等式，证明 Cov ( Ni , Nj ) = - mPiPj . 

19. 如果； c 和 y 同分布，但不--定独立，证明 

Cov(x + y,x-y) = o 

20. 条件协方 差公式 (conditional covariance formula ). 对于给定 Z , X 和 Y 的条件协方差由 
下式定义 

Cov ( x , y | z ) = £[( X - E\x\z\){y - e\y\z\)\z\ 

( a ) 证明 

Cov ( X , y | Z ) = E [ XY \ Z ] - E [ X \ Z \ E [ Y \ Z ] 

( b ) 证明条件协方差公式 

Cov ( X , y ) = £[ Cov ( X , Y \ Z )] + Cov ( E [ X \ Z ], E [ Y \ Z ]) 

⑷在 （ b ) 中令 X = y , 就可得到条件方差公式- 

21. 令 X (<) (t = 1,2,.- ， n ) 为 （0,1) 上均匀随机变量 Ai , …， X „ 的 n 个次序统计量， X (0 
的密度为 

勝 »<,<i 

⑷计算 Var ( X (4) ),i = 1,…， n . ( b ) 找出使得 Var ( X (0 ) 达最小和最大值的 i 的值. 
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22 . 

23. 


24. 

(E[XY]) a < E[X 2 )E\Y 2 ) 

提示： 当 y = 对某一 t 成立时，上式等号成立. 其他情 况下， 

0 < E[(tx + y) 3 ] = £[X a )t a + 2E\XY)t + E\Y a ] 
因此，关于 t 的二次方程 


P(X,Y) = 


设 Y = a + 6 X . 证明 

{ +1 6>0 
-1 6<0 

设 Z 为标准正 态随机变量， y = a + 6 Z + cZ 2 , 证明 
p{Y,Z)= *■ 

证明柯西一 施瓦兹 不等式，即 


- V6 2 + 2c 2 


E [ X 2 ) t a + 2 E [ XY]t + E [ Y 2 ] = 0 

的根为复数，故其判别式为负值. 

26. 设 X , y 相互独立，在下列两种情形下，证明 

E [ X\Y = »] = £[ X ] 对 •切! /成立 
( a ) 离散 情形； （ b ) 连续情形. 

26. 证明 E [ g ( X ) Y \ X ] = g { X ) E [ Y \ X ). 

27. 证 明：若 E \ Y\X = i ] = £[ y ] 对一切; r 成立，则 X , Y 不 相关. 同时，给出一个反例，说 
明逆命题不真. 

提示： 证明并利用公式 E [ XY \ = E [ XE \ Y \ X )\. 

28. 证明 Cov ( X , f ；[ y | X ]) = Cov ( X , Y ). 

29. 设 X u …， X n 为独立同分布随机变童序列，求 


£[X,|Xi+--- + X„=x] 


30. 考虑关于多项分布的例 4 f , 利用条件期望计算 ElNiNA ， 再利用此公式验证关于 Co ^ NiNj ) 
的公式. 

31. 设在坛子中，原有6个艱球和个白球,每一步放入 r 个黑球然后再随机的拿出 r 个球， 

指出，经过 t 步以后 , 

E[ 白球数 1 = ( r ^0 w 

32. 令 /a 为事件4的示 性变量 ，即 



对于任 意随机 变量； f , 证明公式 


A 在试驗 中发生 
A 在试驗中不发生 





理论习题 347 


33. 设掷一枚硬币，其正面朝上的概率为 p . 现在连续掷硬币，直到连续出现 f 次正面朝上为 
止，求掷硬币次数的期望值. 

提示： 记第一次出现反面朝上的时刻为7\在 ! T = t 的条件下，求掷硬币次数的期望，得 
到方程① 

E [ X ] = E \ X\T = t ) - P{T = t } + rp T 

t=i 

= (i-p)Ep t_ 1 (*+®W)+n> r 

然后解出 E [ X ). 

34. 理论习题 33 的另一种解法.记 7； 表示出现连续 r 个正面朝上所需的掷硬币次数. 

⑷求 JSpVIU ( b ) 将 E ( T r ) 表示成 E [ T r _ i ] 的函数 

( c ) E \ T {\ 是多少？⑷ E [ T r ] 是多少？ 

35. 设 X 为取非负整数值的离散型随机变量，其分布列为 P{X = j } = p it j > 0,它的概率 

矩母函数由下式 定义： x 

4>{ a ) = E [ a x ) = 53 p〆 
i=o 

设 y 具有几何分布，参数 p = 1 - a , 其中 s e ( o , 1 ). 又设 y 与久相互独立.指出 

♦ ⑷ = p[x < y} 

36. 设某坛子内有 a 个白球，6个黑球.一次从坛子内随机取出一个球，直至坛子中的球变成 
同 一 颜色.记 M a 6 表示试驗结束时坛子中的球的个数的期望值_导出一个通推公式，并 
且当 a = 3,6 = 5时求出 M 0 fc . 

37. —个坛子里有 a 个白球， b 个黑球.从坛子里随机地取出一个球，如果这个球是白球，就 
放回坛子，如果是黑球，就放入一个白球作为替换•记表示经过 n 次取球以后坛子里 
的白球数的期望值. 

( a ) 导出下面的递推公式 

Mn+1 = G _ B) Mn + 1 

( b ) 利用 （ a ) 证明 , 1 、n 

M n = a + 6 - 6(1 - ^ + 6 ) 

( c ) 第 n + 1 次从坛子里取出一个白球的概率是多少？ 

38. 设 Y , Xi , X , 为随机变量.基于 A !， X 2 的 y 的最优线性预测是使 

E [( y-(o + 6 Xi + cX 2 )) a ] 

达到最小的 a + bXj + cXa . 求最优线性预测中的系数 a , b , c . 

39. Y 的基于 X 的最优二次预测 a + Wf + cX 2 是使 

£[(y-(a + 6X + cX 2 )) 3 ] 

达到最小的二次三项式 a + bX + cX 2 . 求最优二次预测中的系数 o ,6, c 的值. 


①此方程与原文稍有不同.——译者注 
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40. 利用条件方差公式确定#数为 p 的几何随机变量 A ： 的方差. 

41. 设 X 为正态随机变童，其参数 /X = 0,<7 2 = 1，令/为与 X 相互独立的随机变童， 
P {/ = 1} = I = P{I = 0}. Y 由下式定义 •• 

I X 1 = 1 
-X 1 = 0 

即 y 以相同的可能等于 X 或 - X . 

( a ) 是否相互独立？ （ b ) 是否相互独立？ 

( c ) 指出 y 的分布为标准正态 分布. （ d ) 指出 cov ( x , y ) = o. 

42.设 y 的依赖于 A ： 的最优线性预测为 n u + p ^(. x -^), 则由命题 6.1 可知，若 
E \ Y \ X]=a + bX 

则 „ a 

O = /Xy — b = p -^- 

(为什么?）请直接证明此结论. 

43. 对于随机变量 X 和 Z , 证明 

E ^ X - y) 3 ] = E [ X 2 ) - E \ Y 2 ] 


其中 y = e [ x \ z \. 

44 . 考虑一个总体，总体中的每一个个体都能产生后代.假定总体中的每一个个体，当它的生 
命结束的时候，具有 j 个子代的概率为巧, j > 0,子代的个败与别的个体的子代个数独 
立.现设最早的个体的个败义 0 称为第0代的大小.第0代个体的子代称为第1代个体， 
记第1代个体总数为依此类推，可得到第 n 代个体总和为 X„ ，记/ x = ET = oJ P i < 
a 2 = 它们分别表示一个个体的子代的个数的期望和方差.现假定 X 0 = 

1,即第0代个体只有一个. 

⑷指出 E [ Xn \ = MU-1】.（b) 利用 （a), 证明 E [ X n ] = M n - 

(c) 指出 Var(X„) = aV -1 + M J Var(X„-,). 

(d) 利用 （c), 证明 


v „ 队卜卜 ' ㈣ … 

fi = l 

刚才介绍的模型称为分枝 过程- 分枝过程的一个重要问题是总体灭绝的概率，记 n 表 
示由一个个体出发，其总体灭绝的概率，即 

n = 总体灭绝 |Xo = 1}. 

(e) 证明： n 满足 x 

i=0 

提示 ：以第 1 代的个体数作条件，求出灭绝的条件概率 • 
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45. 验证表 7.2 中均匀分布的矩母函数的公式，同时用求微商方法求出相应随机变量的期望 
和方差. 

46. 对于标准正态随机变董2,令如= £[Z"], 指出 

fo «为奇数 

吻― 

提 示：将 Z 的矩母函数在0处展成泰勒 级数： 

E[e tz ) = e^ = ±^- 

47. 设欠是•个正态随机变量，其参数为 W 2 ). 利用理论习题46证明 


[»/21 


J-0 


( 2 ")M n - a V«(2j)! 


其中， [n/2] 表示 《/2 的整数部分.在 n = 1,2 的情况下，通过直接计算验证本题的 
公式. 

48. 设 y = a 久 + 6,其中 a, 6为常数.将 K 的矩母函数用X的矩母函数表达出来. 

49. 取正值的随机 变量叉 称为对数正态随机变量，参数为 （M,a 2 ) .如果 InX 的分布为正态, 
期望为叫方差为利用正态矩母函数找出对数正态随机变量的期望和方差. 

50. 设 A： 的矩母函数为 Af(t), 定义*⑴= InM ⑷. 证明⑴|«= 0 = Var(X). 

51. 利用表 7.2, 求出 E?=, Xi 的分布，其中 X* 为独立同分布的随机变童，其公共分布为指 
数分布，期望为 1/A. 

52. !kX，Y 的联合矩母函数求出 Cov(X.y). 

53. 具有多元正态 分布. »lli X,, -- ,X n 相互独立的充要条件是 


Cov(X i ,X i ) = 0,i^j 


54. 设 Z 为标准正态随机变*，计算 Cov(Z,Z a ). 

55. 设 y 具有正态分布，其均 值为叫 方差为 <7 2 .假设 Y = J/ 的条件下叉的分布为正态分 
布，期望为！/,方差为 1. 

(a) 指出 (X,Y) 的联合分布与 {Y + Z,Y) 的联合分布相同，其中 Z 与 K 相互独立，且 
具有标准正态分布. 

(b) 利用 （a), 证明 (X,Y) 具有二元正态分布 • （c) 求 f：[X],Var(X),Corr(X,y). 
⑷求 E]y\x = *]. (e) y 在X = a： 之下的条件分布是什么？ 

自检习题 


1.设由 m 个名称组成的列表,在列表上同一名称可出现好几次.记 n ⑷表示在第 i 个位置 
上的名称在表上出现的次数 i = 1,…， m, 用 d 表示列表上不同名称的个数. 
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⑷将 d 表成 m , n ( t),t = 1,••- ,m 的函数.令17为 (0,1) 上均勻分布的随机变量，令 
X = [ m £/] + 1. 

( b ) X 的分布列是什么？ 

(c) 指出 E [ m / n { X )] = d . 

2. 设坛子里有 ri 个白球， m 个黑球，随机地从坛子中将球一个一个地取出.数一数取出一 
个黑球后紧接着取出一个白球的次数，并求其期望值. 

3. 10对夫妇被安排在5张餐桌上，每张餐桌上有4个座位. 

( a ) 如果座位是完全随机地安排的，求坐在同-•张餐桌的夫妇的对数的期 望值. 

( b ) 如果随机地挑选2个男人, 2个女人坐在一张桌子上，求坐在同一桌的夫妇的对数的 
期望值. 

4. 设连续掷一枚骰子，一直到6个面都出现为止.求点败“1”出现次数的期望值 • 

5. 设有-•副牌，由 n 张红牌和 n 张黑牌组成.将牌洗好以后，顺次地一张一张翻开，当翮出 
一张红牌并且此时己翻开的红牌数比黑牌数多时，你贏得1个单位 .( 例如，若 n = 2,翻 
牌结果是 rbrb , 则此时你总共贏得2个单位）求你贏得的单位数的期望值 • 

6. 设 ，如 ，…，为 n 个亊件，记 N 为这些亊件的发生数，/为一随机变量， 


如果所有亊件都发生 
其他 


证明下面的 Bonferroni 不等式: 


P(A, P (⑹-("- 1 ) 


提示： 首先证明 N ^ n -1 + J . 

7. 设从 {1,2,••• , n } 中随机地取 fc 个败•记久为其中最小的数，将 X 解释 为服从负超几 
何分布的随机 变量， 然后求 E [ X ] 的值. 

8. —架飞机载着 r 个家庭着陆，有〜家带有 j 件行李，当飞机着陆以后， 
N = - Z , jnj 件行李按随机的顒序一件-件的取 出来. 一旦^个家庭收齐了他们的行李就 
立刻¥开机场.现设桑切斯一家有 j 件行李，求在喿切斯一家之后离开机场的家庭数的 
期望值. 

•9. 在半径为1的圆周上，放上19件器材.指出无论怎么安放这19个器材，都至少存在一 
段长度为1的弧，其上至少包含 4 个器件_ 

10. 设 X 是泊松随机 变量， 均值为 A . 指出，若 A 不是太小，有下式 成立： 

Var ('/ X ) « 0.25 

提示： 利用理论习题4中的结果去近似 E [ VX ). 

11. 设在自检习题3中20个人安排了 7张桌子，其中3张桌子上有4个位子, 4张桌子上有 
2个位子.如果20个人是随机地坐，求坐在同一桌的夫妇对数的期望值 • 
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12. 设员工1, ••- , n , 被招聘到某公司，他们是这样被招聘进来的，由第1个人开公司，将2招 
聘进来之后，1和2就竞争着招聘3.当3被招聘进来以后，1, 2, 3就竞争着招聘 4. 假定 
当1,…， i 竞争着招聘 i + 1时，这 i 个人中每一个人能招聘到 i + 1的概率是相等的. 

( a ) 求1,2,"_ ,»»中没有招聘到其他人的人数的期望值. 

( b ) 求出没有招聘到其他人的人数的方差.对于 n = 5,求出它的值. 

13. 9个人组成一个篮球队，其中2个中锋，3个前锋，4个后卫.现将9个人随机地分成3 
组.一组称为完全的，如果这个组含有一个中锋， 个 前锋,一个后卫.求完全组个数的 
( a ) 期望值. （ b ) 方差. 

14. 从-副 52张的扑克牌中随机地抽出13张，分别记 X 和 Y 为 “ A ” 的张数和黑桃的张 
数. 

( a ) 指出 X , Y 不相关 .（ b ) 它们独立吗？ 

15. 设在箱子内有一批硬币， 每个 硬币有一个 p 值，当抛掷这枚硬币时，正面朝上的概率为 
P, 当从箱子内取出一硬币时，硬币的 p 值是在 （0,1) 上均匀分布的.现在，设硬币己经取 
出，在抛掷以前，你必须猜一下抛掷结果，猜对了会贏一个单位，反之会输一个单位. 

( a ) 若不告诉你 p 的值，你的期里所得是多少？ 

( b ) 若在猜测以前，你可以调査得到 p 的值,你应该作怎样的猜测？ 

( c ) 计算 （ b ) 中你的期望所得. 

16. 在自检习题1中，我们指出可以利用 (0,1) 上的均匀随机变童（通常称随机數)，得到一个 
随机变置，且其均值刚好等于列表上不同名称的个数.但是，那里的方法要求选择一个随 
机的位置，并且确定该位置上的名称在列表上出现的次数，现在提供另一个方法，这个方 
法在名称重复次数较多时较为有效.其方法 如下： 首先像习题1中那样选定一个随机变 
S X ,然后确认在位置； f 上的名称，再从列表的开头开始检査，直到这个名称出现为止. 
如果这个名称出现在 X 的前面，则定义 1 = 0, 否则定义 J = 1,证明 E [ ml ] = d . 

提示： 利用条件期望计算 E [ I \. 

17. —共有 m 个物件，顺次放入 n 个房间，每一个物件放在房间 j 的概率为 = 1,2,…， n . 
当某一物件放入一非空的房间，（该房间已经被别的物体占据着）时,则称为出现一个碰揸 • 
求碰揸数的期望值. 

18. 设 n 个1和 m 个0随机地排成-列，令 X 表示这个排列的第一个游程的长度 .( 既可以 
是“1”的游程，也可以是 “0” 的游程.例如，00101,此时 X = 2.) 求£【义]. 

19. 盒子 H 内有 n 个物件，盒子 T 内有 m '个物件.有一硬币，抛掷时以概率 P 正面朝上, 
以概率1 - p 反面朝上.当正面朝上时，从盒子 H 中取走一个物件，当反面朝上时，从盒 
子 T 中取走一个物体.当有一个盒子为空的时候，例如， H 为空的时候，而硬币此时又是 
正面朝上，只好不拿物件.而继续下一次掷硬币，这个过程一直继续到两个食子全空 为止. 
求在两个食子全空时，所掷硬币次数的期望值. 

提示： 以前 n + m 次抛掷的正面朝上数为条件. 

20. 设久为非负随机变量，其分布函数为 FOt ) •记 F ( x ) = 1 - F ( x ). 证明： 

E [ X n ] = J ^° x ^ F^dx 
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~ n J x n ~ 1 Ix(x)dx 


Ix ( x ) = 


I 1 x<X 
1。其他 

■ ,a„ 不全为 0, Er =1 Oi = 0, 指出存在一个排列 ii,---,i„, 使得 


<0 

i=i 


提示： 利用概率化方法.(很有意思的是，可以不存在排列，使得连续两项的乘积之和为正， 
例如 n = 3 , fll = aj = -1,03 = 2, 此时，对所有抹列，其相应的连续两项的乘积和均小于 
或等于 0.) 

22. 设 Xi(i = 1,2,3) 为相互独立的泊松随机变量，均值分别为 A<(i = 1,2,3). 令 X = 
X l + X 3 ,Y = X2 + X 3 , (X,y) 称为具有二维泊松分布的随机向量 .求： 

( a ) 聊和 f ?[ y ]; ( b ) Ck > v ( X , y ); ( c )( X , Y ) 的联合分布列 P{X = i , Y = j }. 

23 . 令 ( Xi , Yi ), i = l ,2, - 为独立同分布的随机向置序列，即 ( XuYi )^ ( X a , y 3 ) 相互独立 
且同分布，等等.虽然， X it Yi 不独立，但却相互独立，令 

Hx = E [ Xi ], Hy = E [ Yi],<Tx = Var ( X<),<rJ = Var ( y ；), p = Corr ( X t , Yi ) 

求 Co rr (EIU 不， EU). 

24. 从一副 52 张牌内抽取 3 张牌（无放回)，记 X 表示选中的 “ A ” 的张数 • 

( a ) 求黑桃“ A ” 己选中 1. ( b ) 求至少一张“ A ” 己选中 1. 

25. 记$为标准正态分布函数， X 为正态随机变量，其均值为方差 < r 2 = 1. 我们要计算 
£[*( X )]. 为此，令 Z 为标准正态随机变量，且与 X 相互独立，令 



(a) 指出 E [ I\X = *] = *(x). (b) 指出 E[*(X)] = P { Z < X ). (c) 指出 £[$(X)]= 

^(/i/%/2). 

提示 （c): X - 2 的分布是什么？ 

这个题目源自统计学.我们将观察随机变量X, X的分布为正态分布，期望为方差为 
1,我们希望检验假设 /x>0. 显然，当X充分小的时候,拒绝 M > 0这个假设.若X = a:, 
则这个假设的 P 值定义为 M = 0的假定之下随机事件{尤< z} 的概率（当 p 值小的时 
候，说明原来的假设可能是假 的). 由于当/! = 0时，；1：具有标准正态分布.因此， p 值为 
吻).当 /x 为真值时, p 值的平均值为$(^). 
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26. 设有一硬币，抛掷时以 p 的概率正面朝上.现在设连续抛掷这枚硬币，直到出现了 n 次正 
面朝上或者 m 次反面朝上为止，求抛掷硬币次数的期望值. 

提示： 设想，当达到 S 的以后，还继续掷硬币.令 X 表示为得到 n 次正面朝上所需的掷硬 
币次数, y 表示为得到 m 次反面朝上所需的裤硬币次数.注意 max ( X , y ) + m in ( X , y ) = 
X + Y . 为计算 £[ max ( X , y )], 首先计算在头 n + m -1 次掷硬币中正面朝上次数固定 
的条件下 max ( X , y ) 的条件期望 • 

27. 设有一副牌共有 n 张,一个洗牌的程序是这 样的： 每次随机地抽出一张牌放在最上面.抽 
出一张牌称为新牌,指的是抽出的--张牌是以前从没有抽到过的牌.这个洗牌过程—直到 
抽出 n _ 1张新牌就停止.这样的过程可以使 n ! 种排列次序以相同的概率出现.求出这 
个洗牌过程的抽牌次数的期望值. 

28. 设有一独立重复试验,每次成功的概率为 P . 当第一次试被成功或者一直到 n 次都未成功 
则试骑停止.求出试验次数的平均值. 

提示： 利用公式 E [ X } = Y：Zx > i }, 其中 X 为非负整数值随机变量. 

29. 设均为贝努利随机变童.指出 X , Y 相互独立的充要条件为 

Cov ( x , y ) = o . 

30. 广义配对 问題是 如下叙述的.一共有 n 个妇女，其中有 n , 个妇女戴的帽子的大小编号为 

i , 现在有 n 顶 帽子， 大小编号为 i 的子有顶， T,：. l hi = n . 现在毎 

人随机地取一顶帽子（无放回).找出拿到自己大小编号的帽子的人数的期望数. 



第 8 章极限定理 

8.1 引 言 

在概率论中，最重要的理论结果是极限定理.极限定理中最重要的是大数定律 
和中心极限定理.通常，当随机变量序列的平均值在某种条件下收敛到某期望值的 
时候，就是大数定律.另一方面，当大量随机变量之和的分布在某种条件下逼近于 
正态分布时，就称为中心极限定理. 

8.2 切比雪夫不等式及弱大数律 


我们开始介绍马尔可夫不等式. 



两边求期望，得 

Ell ]^ - E [ X ) 


上式说明 E [ X]/a > E [ I ] = P { X ^ a }, 即命题结论 成立. □ 


作为推论，可得下列命题. 



证明： 由于 ( X -/ i ) 2 为非负随机变量，利用马尔可夫不等式，得 


P{(X-/x) 2 >fc 2 }^ gl( ^ M)2] (21) 
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由于 （X - M ) 2 > fc 2 与 |X - W > A : 是等价的，因此 

马尔可夫不等式和切比雪夫不等式的重要性 在于： 当我们只知道随机变量的 
期望，或期望和方差都知道时，可以导出概率的 上界. 当然，我们知道概率分布时， 
就可以直接计算概率的值而不必计算概率的上界. 

例 2 a 某工厂在一周内生产的产品的件数为随机变量，假定已知这个随机变 
量的期望值为 50. 

( a ) 本周内产品超过 5 7件的概率有多大？ 

( b ) 如果我们进一步知道每周产量的方差为25,那么本周产量在40到60之间 
的概率有多大？ 


解： 记 X 为本周的产童. 

( a ) 由过去的经验只知道 X 的期望为 M = 50,而不知道 X 的分布.因此，我 
们不能计算相应的概率值，只能利用不等式计算出相应概率 的界. 利用马尔可夫不 
等式，得 


P{X > 75} < 


E [ X ] _ 50 _ 
75 = 75 = 


2 

3 


( b ) 基于与 （ a ) —样的原因，我们利用切比雪夫不等式 
P{\X-50\^10}^^ = \ 


故 


P{\X - 50| < 10} > 1 - J = | 


故本周内的产品在40到60之间的概率至少为 0.75. ■ 

由于切比雪夫不等式适用于所有的分布，因此，不能指望所得的概率的界与真 
实的概率很接近.下面 看-个 例子. 

例 2 b 设 A •为（0, 10) 上具有均匀分布的随机变量，己知 E [ X ] = 5, Var ( X ) = 
25/3. 利用切比雪夫不等式可得 

P{|X-5|>4K^|^«0.52 

而实际上,这个概率为 

P{|X - 5| > 4} = 0.20 


由上式看出，我们只能利用切比雪夫不等式找到概率的界，但不能用来估计概率值 
本身. 
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类似地，设 X 具有正态分布，期望为 /X， 方差为 (T 2 , 利用切比雪夫不等式得到 
P{|X-/i|>2aKi 

而实际概率为 

P{\X - > 2 a } = > 2} = 2[1 - $(2)] w 0.0456 

两者相差很远. ■ 

切比雪夫不等式的主要用途是证明理论结果，例如命题 2.3, 但是最重要的是 
证明大数定律. 


命題 2.3 若 Varpf ) = 0,则 P{X = E [^)} = 1. 也即是说，一个随机变量 
的方差为0的充要条件是这个随机变量以概率为1地等于常数- 


证明： 利用切比雪夫不等式，对任何 n 彡1 

p {| X -/ i |> i }=0 

令 n -♦ 00 ,得 

0 咖- "丨 > 士 } = p { h {〆 - mi > ^ }} = m 

结 论得到证明. _□ 

定理 2.1( 弱大数律）设 X 1 , X 2 , - 为独立同分布的随机变量序列，其公 
共期望 E [ Xi ) = /i 为有限，则对任何 e > 0, 

P {| Xl + 和卜 0 卜°° 


证明： 我们只在 Var ( Xi ) = tr 2 为有限的情形下证明此定理.此时 

利用切比雪夫不等式，得 

由上式看出，定理显然成立. 口 

弱大数律最早是由詹姆士.伯努利证明的_他证明的大数律是一种特殊情况， 
其中只取0或1，即 X 为伯努利随机 变量. 他对该定理的陈述和证明见于他的 
—本书《推测术》，这本书出版于1713年，是在詹姆士.伯努利去世后8年，由他 
的同为数学家的侄子尼古拉斯.伯努利整理 出版. 要知道，当时切比雪夫不等式还 
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不为人知，伯努利必须借助十分灵巧的方法证明其结果.定理 2.1 是独立同分布序 
列的大数律的最一般形式，它由前苏联数学家辛钦所证明. 


8.3 中心极限定理 


中心极限定理是概率论中最著名的结果之一，用粗略的语言来说，大量的独立 
随机变量之和的分布近似地为正态分布.因此，中心极限定理为计算独立随机变量 
和的有关概率提供了理论依据，同时也解释了现实世界中许多实际的总体的分布的 
频率曲线呈现钟形曲线（即正态的）的原因. 

下面叙述的是最简单的中心极限定理. 


定理 3.1 (中心极限定理）设 X 2 , …为独立同分布序列，其公共分布 
的期望为方差为 CT 2 . 则随机变量 

■Xi H - h X n — nfi 

< T\/n 

的分布当 n - oo 时趋向于标准正态分布.即对任何 a e (- 00 , 00 ), 


p f x i + - \- X n -nn 

X ^^ 




证明的关键之处是下面的一条引理，由于证明涉及太多数学上的细节，我们只 
给出陈述. 


引理 3.1 设 Z „ Z 2 , ••-为一随机变量序列，其分布函数为相应的矩 
母函数为 M Zn ,n > 1.又设 Z 的分布为矩母函数为若 M z „ ⑴— 
M z ( t ) 对一切 f 成立，则 F Zn ( t )^ ⑷对 F z ( t ) 所有的连续点成立. 


若2为标准正态随机变量，则 M z ( t ) = e 4 */ 2 , 利用引理 3.1 可知，若 
e t2 /'n —* oo , 则 Fz n { t ) — » $( t),n —♦ c ». 

现在证明中心极限定理. 

中心极限定理的 证明： 首先，假定 M = 0, ( T 2 = 1,我们 只在不 的矩母函数 
M ( t ) 存在且有限的假定之下证明定理.现在， Xi / Vn 的矩母函数为 

£ 卜{费}]-财(去） 

由此可知， E?=l Xi / y / fi 的矩母函数为 | A / 

1⑴ = lnM(t) 
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对于 L ⑷，我们有 


L(0) = 0 1/(0) 


M ; (0) 

= M(0) = 


L " ⑼ 


M(0)M"(0) - [M ， ⑼卩 

: [M(0)p = 


E [ X ) 2 = 


要证明定理，由引理 3.1, 我们必须证明 [ M ( t / y / H)] n - e t2 / 2 ,n — oo . 或等价地, ni 
{ t /^ n ) — » t ^/ 2 ,n —* oo . 

下面的一系列等式说明这个极限式成立 ■ 
lim nHt /^)= lim 利用洛必达法则 

n—oo w v ' n—oo -2 n _ 2 


[^#]= 棚洛必达法则 

= n 1 SSo[ i，， (^) f] = T 

这样,在 m = 0/ = 1 的情况下，定理得以证明.对于一般情况，只需考虑标准化随 
机变量序列，；^ =(久< - P ) Ar , 由于 E [ X ：} = 0, Var ( X ；) = 1,将已证得的结果应用 
于序列 W 便可得一般情况的 结论. 口 

注释虽然定理 3.1 只说对每一个常数 a , 有 

p { Xl+ ' a ^ n ~ n - “卜 少⑷ 

事实上，这个收敛是对 a —致 的. [我们说函数 /n ⑷ -» /⑷， n -» oo 对 a —致，是 
说对任何 e > 0,存在使得当 n > N 时，不等式 l /„( a ) - /⑷ | < e 对所有的 a 
都成立 . 1 * 


第一个中心极限定理是由棣莫弗在1733年左右给出证明的.他的证明限于不 
为伯努利随机变童，并且 P = 1/2. 后来,拉普拉斯将这个结果推广到一般的 P 的情 
况. 由于二项随机变貴可以看作独立同分布的伯努利随机变量之和，因此，此处得 
到的中心极限定理为第5章 4 .1 节关于二项分布的正态通近提供了理论依 据拉普 
拉斯也发现了中心极限定理的更一般的形式，但他的证明不严格，事实上，沿用他 
的方法也不可能严格化.真正严格的证明是由俄国数学家李雅普洛夫在 1901 ~ 1902 
年间给出的 • 

网站上有一个中心极限定理的模块演示及计算结果，该模块将 n 个独立同分 
布随机变童之和的密度（分布列）演示出来.每个随机变童只取0，1，2,3,4共5个 
值，当输入分布列以及参数 n 以后，就可以显示它们的和的分布列的形状•图 8.1 
显示了 （ a ) n = 5, ( b ) n = 10, ( c ) n = 25 和⑷ n = 100 的计算 结果- 



图 8.1( c ) n = 25 


图 8.1( d ) n = 100 


例 3 a —个天文学家要测量遥远的恒星到地球之间的距离（单 位： 光年).天 
文学家知道，由于大气条件以及仪器误差，每次测量都不会得到距离的准确值，而 
只是一个估 计值. 因此，天文学家只得进行一系列测量，用这些测置值的平均值作 
为距离真值的估计值.若天文学家认为各次测量值是独立同分布的各随机变量的 
观察值,随机变量的公共分布的期望值为 rf (距离的真值)，公共方差为 = 4,那么， 
要重复测量多少次才能达到 ±0.5 光年的精度？ 

解： 设观察次数为 n, Xu... ,X„ 为 n 次测量值，由中心极限定理知随机变量 
tXi-nd 

ry i=l 

Zn 2> 


具有近似标准正态分布.因此 
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P \ -0.5 < - E?=i - d ^ 0.5 [ 


= p|-0.5^$Z n ^0.5^| 


如果天文学家希望以95%的把握保证估计值与真值之差在 0.5 光年以内，他 
应作 n * 次以上重复测量， n * 满足 

2$(^) - 1 = 0.95 或 =0.975 

由第5章的表 5.1 得 

¥.= 1.96 或 n * = (7.84) 2 « 61.47 
由于 n * 不是整数，因此他应作62次重复观测. 

前面的分析中有一假定，正态逼近是好的近似.尽管 n = 62在通常情形下， 
2„与标准正态分布己经很靠近，但是与标准正态分布逼近程度还依赖于的 
分布.若天文学家对于正态逼近还没有把握，他可以利用切比雪夫不等式.由于 


由切比雪夫不等式知 






n (0.5) 2 = 


令 16 /n = 0.05, 得 n = 320, 此时，他可以以95%的把握保证其估计精度在 0.5 光 
年以内. _ 

例 3 b 己知某心理学课上注册的学生数是一个泊松随机变童，其期望值为 
100. 任课教授决定如果注册人数为120人或更多时，他将采取分班授课的形式， 
否则就一个班上课.该教授采用分班授课的概率有多大？ 

解： 这个概率的精确解为 e - 100 E ~ i 20^. 这个数并没有给出这个概率有 
多大的 概念. 然而,均值为100的泊松随机变量可以看成100个均值为1的独立同 
分布的泊松随机变量之和，由此，可以利用中心极限定理得到近似解.记 A •为注册 
的学生数 

连续性修正 


P { X > 120} = P { X ^ 119.5} 


=十 


- $(1.95) « 0.0256 


^100 ^ v/loo 

此处，我们在应用中心极限定理时,利用了泊松分布的期望和方差相等这一事实. ■ 
例 3 c 设一共掷10枚均匀的骰子,找出点数之和在30和奶之间的概率的近 
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似值 • 

解 ：设足 表示第 i 个殺子的值 ， i = 1,2,…， 10. 由于 

E ( Xi ) = I Var (不) =£的]—剛 j ) 2 = g 
利用中心极限定理 


P {29.5 40.5} = P 



« 2$(1.0184) - 1 « 0.692 


例 3 d 令尤 , i = 1,…，10是相互独立的随机变量，其公共分布为 （0,1) 上的 
均勻分布，计算 P { E 4 = i ^ i >6} 的近似值. 

解： 由于 £7[ Xi ] = l /2, Var ( X <) = 1/12, 利用中心极限定理 

p {e^> 6 } = p 

因此， E !^ 大于6的可能性只有 14%. ■ 

例 3 e —个教师需要判 50 道试题.评判每道题需要的时间形成一个独立同分 
布的随机变量序列，其公共分布的期望为 20 分钟,标准差为 4 分钟.问他在 450 分 
钟内判完至少 25 道题的概率有多大（近似值)？ 

稱 ••令 Xi 为判第 i 道题所需的时间，则 

25 

i=l 

为判完 25 道题所需的时间.按题意，在 450 分钟内，他判完这 2 5 道题的概率为 
P { X < 450}. 利用中心极限定理求其近似值.由 

25 25 

E [ X ] = ^2 E [ Xi ] = 25 x 20 = 500, Var ( X ) = ^ Var ( Xi ) = 25 x 16 = 400 
«=i *=i 

我们得到 

, ,„ f X - 500 450 - 5001 

p{x<450} = p < ~ vm ~] 

w -2.5} = 1 - $(2.5) = 0.006 

上式中 2 为标准正态随机变量. ■ 

当兄独立，但不一定为同分布时，中心极限定理也成立，其中一个（但决不是 




1 -*(\/ L 2) « 0.1367 
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最一般的）版本如下所述. 

定理 3.2( 相互独立随机变量序列的中心极限定理）设 X U X 2 , …为相互 
独立的随机变量序列,相应的期望和方差分别为= E [ Xi },^ = Vai ( Xi ). 
若 （a) Xi 为一致有界的，即存在 M, 使得 P{|Xi| < M} = 1对一切 i 成 
立； 且 (b)I：~i^ ? = +00,则对一切 a, 



历史注记 


皮埃尔.西蒙拉普拉斯侯爵 

皮埃尔.西蒙.拉普拉斯侯爵就是我们熟悉的法国数学家拉普 拉斯. 中心极 
限定理是由拉普拉斯提出并证 明的. 他观察到测量误差（通常认为测量误差是由大 
童很小的偶然误差叠加而成的）具有正态分布.拉普拉斯也是著名的天文学家（他 
被称为法国的牛顿)，他是早期概率论与统计的理论莫基者之一，同时积极推广概率 
论在日常生活中的应用.他坚信概率论对人类具有深远意义.他在一本名为《分析 
概率论》的书中说 :“我 们发现概率论其实就是将常识问题归结为 计算. 它使我们 
能够精确地评价凭某种直观感受到的、往往又不能解释清楚的现象……值得注意 
的是，概率论这门起源于机会游戏的科学早就应该成为人类知识最重要的组成部 
分……生活中那些最重要的问题绝大部分恰恰是概率论问题•” 

中心极限定理的应用揭示了这样的事实，测童误差近似地正态分布，这个统计 
规律是对科学的重大贡献，在17,18世纪，中心极限定理常被称为误差頻率定律- 
FVancis Galton 在他1889年出版的书《自然遗产》中曾 说过: “我知道，几乎没 
有一种理论能够像误差频率定律那样神奇,那样貼切地体现宇宙次序.如果古希腊 
人知道这个规律的话，就一定会将它人格化或神化.它在混乱中保持着平静，情况 
越复杂、混乱，它的主导作用就越 完善. 它是最卓越的、不可思议的规律 •” 

8.4 强大数律 

强大数律是概率论中最著名的结果，它说明，独立同分布随机变量序列，前 n 
个观察值的平均值以概率为1地收敛到分布的平 均值. 
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定理 4.1( 强大数律）设 X U X 2 、… 为一独立同分布的随机变童序列，其 
公共期望值 M = E [ Xi ] 为有限，则下式以概率为1地 成立： 

X' ■¥ X 】+ • • • + X n ① 

- * n n —* oo 


作为强大数律的一个应用，设有一独立重复试验序列 ，令五 为某一亊件， P ( E ) 
为事件 E 发生的概率，令 


1 E 在第 i 次试验中发生 
0其他 


根据强大数律， 

Xi + -- + X n — E ^ = P ( E ) (4.1) 


Xt + ■■■ + X n 表示在前 n 次试验中， 事件芯 发生的次数， （4.1) 式说明亊件 E 在前 
n 次试验中发生的频率以概率为1地收敛到它的概率 P ( E )： 

虽然这一条定律可以不加任何条件地证明，但是在本证明中，我们假定不具 
有有限4阶矩，即假定五 [#] = K < oo . 

强大数律的 证明： 首先假定五尤 = /i = 0.记= Z 7= iXi , 考虑 


赋1 =£[(^ + ... + X„)(Xi + ■■■ + X n ) 
x(Xi + …+ X n )(Xi + • • • + X n )] 
将上式右边期望号内的多项式展开，得到下列各项之和： 


Xt XfXj xfx] XfXjXk 和 XiXjXkX, 

由于 丑；^ = 0, 利用独立性得到 

E[XfXj] = EiX^ElXj] = 0 
E[XfXjX k ] = E[Xf]E[Xj]E[X k ] = 0 
ElXiXjXkXi] = 0 

在展式中， X , 4 的系数为 1, 故在五【功中可将所有#的期望合并成 TiEpq 1 ] •对 
固定的 ( ij ), 5" 的展式中一共有= 6项.因此，对的展式中与 X ? X ? 
有关的那部分为 6 Zi d XfXl 其中求和号是对 { l ,2,---, n } 的所有两元素组合而 

①》大数律可以表为下式： 


+ •■• + X n )/n = /x} = 1 
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求的. 因此,它的期望为 6 Q ) E [ XfXj ], 这样， 

五[功= nE [ X ^] + 6 QE [ XfXj ] = nK + 3 n ( n - l ) E [ Xf ] E [ Xj ] 
在第二个等式中，我们再一次利用了独立性.我们注意到 
0< Var ( X ?) = E [ Jf i 4 ]-(£；[ X ?]) 2 

由此可得 


这样， 


E [ S ^] ^nK + 3 n ( n - l)K 


从而 

由上式可知 

4群卜 IH 祭卜 

即随机变量 Zn=i S */ n * 的期望为有限,说明以概率为1地有 E ~= i 对 / n 4 < oo .( 若 
E^=i S */ n 4 不是概率为1地有限，则 E~=i 5 i / n 4 的期望为无限）再利用级数的 
性质可知，以概率为1地有 

”1气 ^ = 0 

上式说明，以概率为1地有 

—— » 0 n —♦ 00 
n 

当 /x = E [ Xi ) # 0的时候,我们可以化成期望为0的情况来处理.由于 E [ Xi - 
/ z ] = 0, 利用刚才得到的结论，可知以概率为1地有 

^ =0 

即以概率为1地有 

n ^Ef=/* 


这就是定理的结论. □ 

在网上有两个模块可显示强大数律，它们考虑独立同分布随机变量序列，每个 
随机变量只取0,1,2,3,4这5个值，模块模拟 n 个这样的随机变童，然后，计算每 
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个可能值出现的频数，以及样本均值 E ?= i ^</ n - 这两个不同模块的差别是微小的， 
只是在图像表达上有一些不同.在使用这些模块时，我们只需输入 n 的值，以及随 
机变量 X 的取值的概率（分布列).图 8.2 给出了一个具体分布列的模拟结果，参数 
分别为⑷ n =100, ( b ) n = 1000, ( c ) n =10 000. 模拟结果显示样本均值趋于 E [ X ]. 



图 8.2(a) n= 100 图 8.2(b) n = 1000 



图 8.2(c) n = 10 000 

许多学生往往混淆弱大数律与强大 数律. 弱大数律只能保证对充分大的 n •，随 
机变量 (Xi + --- + X „.)/ n * 靠近 M . 但它不能保证对—切 n > n \ {Xi + -■- + X n )/n 
也一定在 M 的 附近. 这样 ， KA + ••• + X„)/n - n \ 可以无限多次离开 0( 尽管出现 
较大偏离的频率不会很高_ ) 而强大数律能保证这种情况不会出现，强大数律能够 
以概率为1地保证,对于任何 e > 0, 
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只可能出现有限次. 

法国数学家博雷尔最早在伯努利随机变量的特殊情况下证明了强大数律.而 
一般情况下的定理 4.1 的证明是由前苏联数学家 A . N . 科尔莫戈罗夫给出的. 

8.5 其他不等式 

有时候，我们需要求出概率 P{X - > a } 的上界，其中 a 为一个正数，而均 
值 M = E [ X ] 和方差 a 2 = Var ( X ) 是已 知的. 由于当 a >0 时，蕴含 
\ X -^\> a , 利用切比雪夫不等式可知 

P{X - a ) ^ P{\X - ^ i | ^ o } ^ o > 0 
然而，下面的命题指出，我们可以得到更好的上界（上界越小，就越好). 


命题 5.1 (单边的切比雪夫不等式）设 A •具有 0 均值和有限方差〆 ， 则对 
任意 a > 0, 

P ^ X 彡対 < 


证明： 令 6>0, 注意到 


故 


X^a^X + b^a + b 


P{X > a } = P{X + 6 > a + 6} < P{(X + b ) 2 ^ (a + b ) 2 } 


上式中，由 X + Ga + i >>0 可推知 （X + 6) 2 彡 （a + 6) 2 , 故不等式成立.再利用马 
尔可夫不等式 

P{X 彡 a } < P{(X + b) 2 > (a + 6) 2 } < £[(X + 6 ) 2 ]/(a + b) 2 = (< r 2 + b 2 )/(a + b) 2 

上式中 ，6 可以取任何常数，取 6 = a 2 / o , 便得到本命題的结论.实际上，当6 = < r 2 /a 
时， （ cr 2 + ^)/(0+ b) 2 达到极 小值. □ 

例 5 a 设某工厂每周的产量是一个随机变量，其期望为 M = 100,方差为《7 2 = 
400. 现在问这一周产量至少为 120 的概率的上界是什么？ 

解： 利用单边切比雪夫不等式 


P { X > 120} = P{X - 100 ^ 20} < 


400 = 1 

400 + 202 =2 
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故本周产量至少为120的概率不会超过 1/2. 但如果直接利用马尔可夫不等式， 


P{X ^ 120} < 


E [ X ) ■ 


这个上界就比较弱 ®. ■ 

现在设 X 具有均值 M , 方差由于 X - / i 与 /X - X 都具有均值0和方差 
ff 2 , 利用单边的切比雪夫不等式可知，对于 a > 0, 

- A ■彡 a} < ^ 2 °^ 0 2 


因此，我们得到下面的推论. 

推论 5.1 若 E [ X ] = M,Var(X) = a 2 , 则对于 o > 0,下列不等式 成立： 
P{X</x-a}< ^5^2 

例 5 b 有一个200人的集体，由100个男人和100个女人组成，将他们随机 
地分成100个组, 2人一组，求最多30个组由一男一女组成的概率之上界 • 

解： 将男人编号，由 1 到 100, 对于 i = l, " - ,100, 令 


| l 男人 i 所在的组内有女人 

\o m 


这样，男女配成对的组数 X 可以表示为 

100 

<=i 

男人 i 与其他任何人配成一组的概率是相同的，因此 
五 [不1 = P i X i = !> = 

对于 i / j , 由于男人 i 已经与一个女人配对的条件下， 男人 j 只可能跟197人配 
对，其中99人为女人，因此 

99 

P{Xj = l|Xi = 1} = — • 


①上界越小，结论越强，若上界为1,这个结论就没有任何意 义了. ——译者注 
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E [ XiXj ) — P{Xi — l,Xj = 1} 


这样, 


= P{Xi = l } P{Xj = l\Xi = 1}= 


E [ X \ = 53 E [ Xi ) = 100 x ^ « 50.25 
100 

Var(X) = Y, Var(X<) + 2^^ Cov(X“ 々） 




由切比雪夫不等式 

P{X < 30 } < P{\x- 50.251 ^ 20 . 25 } < ^02^ 2 ^ 0061 
由此看出，最多 30 对为一男一女的概率之上界为6.1%.但是，也可以利用单边的 
切比雪夫不等式 

^« 30 }=.^< 50.25 - 20 . 25 } « 謂 , ：印 - 0.058 

这样,将上界稍作改进. ■ 

当 X 的矩母函数己知时，我们可以得到更加有效的 P{X ^ a} 的上界，令 
M ( t ) = E [ e tx j 

为 X 的矩母函数.对于 t > 0, 

P{X ^a} = P{e tx > e ta } < £[ e tx ] e _,a 利用马尔可夫不等式 


类似地，对于 t < 0, 

P{X 彡 a } = P { e tx > e 40 } ^ E [ e * x ] e -to 


这样，我们得到了切尔诺夫界. 


命题 5.2( 切尔诺夫界） 

P{X >a} < e ~ ta M ( t ) 对一切《 > 0 
P{X <a} ^ e-* 0 M ⑴ 对一切 t < 0 

由于切尔诺夫界对一切适用的 t 都成立,我们可以找到 t ,使 e - to M («) 达到最 
小值.例如，为找到 P{X > a } 的最小上界，可求 e-*«M(t) 在 f > 0上的最小值 • 
例 5 c (标准正态分布的切尔诺夫界）设 Z 是一个标准正态随机变量，它的矩 
母函数为 M ( t ) = e t2 / 2 , P{Z > a } 的切尔诺夫界为 

P{Z >o} < e ~ ta e t3/2 对一切 * > 0 
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对于 t 在 (0, oo ) 上变化，当 t = a 时达到极小值.这样，对于 a > 0, 
P{Z ^a}< e-° 2 / 2 


同理，对于 a < 0, 


P{Z <o}< e- a * /2 


例 5 d (泊松随机变量的切尔诺夫界）设 X 是一个泊松随机变童，其参数为 
其矩母函数为制⑴=因此, P{X ^ *} 的切尔诺夫界为 
P{X 彡 i} < e A ( e ， _1) e -<t «>0 


上式右边的极小化等价于 A ( e * -1) - zt 的极小化问题,这个极小化问題当 e * = i/A 
时达到极小值.只有当 i/A > 1时，相应的极小点 t 的值大于 0. 因此我们在 i > A 
之假设下®，令= i / A ， 可得 

P{X e 馨 - 1 ) x ( 令 ) * 


即 


P{X 彡 i } < 


e - x ( e\y 
~ T * ~ 


例 5 e 设一个赌徒，每次赌博输和贏的概率是相等的，并且输贏与过去的历史 
是相互独立的,每次输和贏的数目是一个单位，设表示第 i 次赌博贏的单位数 • 
则兄相互独立，且 

P{Xi = 1} = P{Xi = -l} = \ 


记= Er = i ^ i 表示经过 n 次赌博后该赌徒的累计贏钱数，我们求 P{Sn > a } 的 
切尔诺夫界，注意 X 的矩母函数为 

E [ e tx ] = ^jl 

利用 e * 和 e _ t 的 McLaurin 展式，得 

/ #2 t 3 v , * 2 t 3 \ 

et + e_t = ( 1 + t + 2! + 3! + -) + ( 1 - t + 2!-3! + -) 
nf , t 2 t 4 \ 

= 2{ 1 + 2 i + 4! + -} 

- 2 „?〆 S 

= 2 〆 / 2 


由于 (2 n )! > n !2 n 


故 


E[e tx ] > e t2 / 2 


①在 i < A 的情况下，本例的上界可能不正磽.——译者注 
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利用独立随机变量和的矩母函数等于各随机变童矩母函数的乘积，我们得到 

£[e ts -] = (£[e tx ]) n < e nt2 / 2 

再利用关于切尔诺夫界的公式可得 

P{S n 彡 a } 彡 e~ ta e nt ^ 2 t>0 

通常为了求得更好的结果，我们需要求上式右边的极小值,或等价地，求 nt 2 /2-ta 
的极小值.利用二次式极小值的公式易知，当 f = a /« 时, e - to e » t 2 /2 达极小值，假 
定 a > 0,此时* = a / n 取正值，将这个值代入切尔诺夫的界中，得 
P{S n ^ o }< e-° 2 / 2n o >0 

例如，由这个不等式，可得 

P{Sio 彡 6} < e _36/2 ° w 0.1653 

经计算，实际的概率值 

P{S W >6} = />{在10次赌博中至少贏 8 次} 


ro + Q+o 

2^0 


下面的不等式是关于期望的不等式. 


定义一个二次可微的实值函数 /(; r ) 称为凸的，若 f"{x) ^ 0对一切 a : 
成立；类似地，若 f"(x) < 0,对一切 z 成立，则称/为凹的 • 


凸函数的一些例子如 /(a:) = i 2 ,/(i) = e ax ,f(x ) = 
的，则 g(aO = -f(x) 就是凹的，反之亦然. 


x 1/n ,x > 0.若 /( a :) 为凸 


命题 5.3( 詹生不等式）设 /( z ) 为凸函数并且 E[X] 存在且有限，则 
E[f(X)} > f{E[X\) 


证 明：将 /⑷在卩= E[X) 处进行泰勒展开， 

/(*) = /(#) + _ M ) + ’"(《)(厂 )2 

其中 （ 是在 a ： 与 A * 之间的某个值•由于 /〃(€)> 0,我们得到 
f{x) > /( m ) + - n) 

因此 

/(x)>/( M )+r(M)(x- M ) 

两边取期望得 

E[f(X)] > /( M ) + J\H)E[X -n]=f^) 





8.6 用泊松随机变量逼近独立的伯努利随机变量和的概率误差界 371 


命题得证. □ 

例 5 f —个投资者会遇到这样的问题，她可以将所有钱财投入一个具有风险 
的计划，其回报为一个随机变量，期望为 m , 也可将钱财投入一个没有风险的计划， 
这个计划的回报为 m ， 且以概率为1地是一个常数，两种方式的回报的期望都是 m , 
她选什么为好？现在假定她有一个效用函数 n(R), 其中 i ? 为回报值，且假定她期望 
获得最大的 E[u(R)}. 通常 u (丑）为的增函数，第一种投资方式的效用为 u ( X ), 
第二种方式的功效为 u ( m ), 若 u(R) 为凹函数，则由詹生不等式 E[u{X)] ^ u(m), 
她应选择没有风险的投资方式，若 u(R) 为凸函数，则 E [ u ( X )] > u ( m ), 她应选择 
具有风险的投资方式. ■ 


8.6 用泊松随机变量逼近独立的伯努利随机变量和的概率误差界 


本节中，我们要讨论用泊松随机变*:逼近独立伯努利随机变纛和的问题，其中 
伯努利随机变量的均值为 Pi , i = 1, 2,…， 71. 

开始时，先设 n ，…，为独立的泊松随机变置，其参数为 Pi , t = 1,2, 

现在我们指出，对每一个 i , 由 R 可构造出伯努利随机变量其参数为 Pi , 并满 
足条件 



令叭，…，队为独立的随机变量序列，且与 y „ - ,Vn 独立 • 认的分布由下式 
给出. 

P{Ui = 1} = 1 - (1 - W P{Ui = 0) = (1- Pi)e^ 

由于不等式 e-P > 1 - P , 保证了上式中 （1- P *) e »> ‘在 (0,1) 区间内，从而保证了定 
义 Ui 的合理性， 现在定义 X“ 

fo 若 y ; = [/< = () 

X* = < 

其他 

注意到 


P{Xi = 0} = P{Yi = 0}P{Ui = 0} = e- p4 (l - Pi)eP* = 1 - p* 

P{Xi = 1} = 1 — P{Xi = 0} = p< 

由兄之定义看出， 若 Xi = 0, 必有 Vi = 0 .故 
P{X i ^Y i } = P{X i = \,Y i ^l} 

=p{Xi = i,y 4 = o} + P{Xi = 1， > 1} = p{Xi = i,y 4 = o} + p{Yt > 1} 

=P{Yi = 0,Ui = l} + P{Yi > 1} = e~ pi [1 - (1 - Pi)^ 4 ] + 1 - e~ Pi - Pie~ Pt 
=Pi - Pie~ Pi ^ Pi 利用 1 - e _p < p 



372 第 8 章极限定理 


由不之定义可知，只依赖于 C / i 和4而 ( YuUi ),--- ,( Y n , U n ) 是相互独立的 • 
因此， X u -, X n 也是相互独立的.这样，我们所构造的随机变量序列 X lt ■■- , X n 
是相互独立的伯努利随机变童序列，其参数为 Pl ，…， P „, 并且满足条件 

P { Xi ^ Yi }^ p ^ 

记 X = EtiXi,Y = Ei =1 y ^ 由上式可知 

P { XjiY }^^ 

现在设>1为任何实数之集合,则下列事件之^合恒等式成立 

{ XeA ) = { X ^ A,Y eA ) + { XeA,Y iA ) 

{Y e A } = {X e A,Y e A) + {Y e A,x i A } 

由上式可知 

P{X eA }- P{Y € A } = P{X e A,Y ^ A } - P{Y € A,X ^ A ) 

进一步可得 

| P{X £ A }~ P{Y G ^}| < P{X € A , Yij ^ A ) + P{Y £ A,X iA } 

又由于 e g 与 {y e g >1} 互不相容，它们之中任一事件发生，必 

有 XjiY 发生，故 

P{X e A,Y ^ A } + P{Y € A,X ^ A } ^ P{X 
综合起来，可知，对任何实数集合次 

| P {^ GA }- P { re ^} K ^ P ? 

利用泊松随机变量的性质可知 ， y = Er = i > i 也是^松随机变量，其参数为 a = 
1^ =1 仍，利用 y 的分布列可得 

KIH-s 宇 

注释当所有的内都等于 P 时， X 就是—项随机变霣，上式变成 

Ii € i 4 «€A I 


小 结 

马尔可夫和切尔诺夫不等式是概率论中十分重要的不等式，可提供有关概率的 
上界.马尔可夫不等式所涉及的是非负随机变量，对于非负随机变量 X , 


P{X >a}< 


E[X) 



习 超 373 


切比雪夫不等式是马尔可夫不等式的应用.设 X 具有期望/ X ，方差 a 2 , 则对 
于每一个 fc > 0,有 

此不等式中的随机变量 X 不再限于非负随机变童了. 

概率 论中两个最重要的理论成果 是中心板限定理和强大數律， 它们都讨论独立 
同分布随机 变量: 序列的性质.若这些随机变量具有期望 M 和方差 < r 2 , 则中心极限 
定理说明当 n 充分大时，这个序列的前 rv 个变量的和的分布，近似地为正态分布, 
其期望为 n / i , 方差为 rur 2 . 设 {Xi,i^l} 是这样的一个序列，则对于每一个实数 a , 

limp/ X 1 + ... + X n -n^ 1 r e -^ /idx 

n -»°° L <Ty/n J y/2n J-oo 

强大数律只要求该序列中的随机变量具有有限均值强大数律说明，当 n 趋 
于无穷时,这个序列的前 n 项的平均值以概率为1地趋于由强大数律可知，在 
独立重复试验中，事件4出现的频率以概率为1地趋于概率 P(A ). 如果将以概率 
为1，解释成“一定”，这样，我们就验证了概率的频率定义的合理性. 

习 题 


1. 设 X 是一随机变 *, 其期望和方差均为 20. 对于概率 F {0 < X < 40} 有什么结论？ 

2. 根据过去的经舱，一个学生的期末成绩是一个随机变量，其均值为 75. 

( a ) 给出学生超过85分的概率的一个上羿 • 

假设还知道学生成绩的方差为 25. 

( b ) 对于学生成绩在 65 - 85 之间的概率，你有什么结论？ 

( c ) 设参加考试学生人数为 n , n 多大时，才能以90%以上的把握保证学生的平均成绩 
在75 ±5这个范围内？请不要利用中心极限定理. 

3. 利用中心极限定理解习題 2( c ). 

4. 设 A ，…，久 2 0是独立泊松随机变量序列，期望为 1. 

( a ) 利用马尔可夫不等式求的上界 • 

( b ) 利用中心极限定理求 P { E ^ i ^>15} 的近似值. 

5. 将50个数利用舍入法化成50个整数，设舍入误差的分布是 （-0.5,+0.5) 上的均匀分 
布.求这50个整数的和与原来的和相差超过3的概串的近似值. 

6. 连续地掷一枚骰子， 直到 点数总和超过300点为止，求至少需掷80次的概率的近 
似值. 

7. 一个人有100个灯泡，每一个灯泡的寿命为指数分布，其平均寿命为5 小时. 他每次 
用一个盯泡，灯泡灭了以后立即换上一个.求525小时后，他仍有灯泡可用的概率的近 
似值. 

8. 在习题7中，假定换一个灯泡需一定时间，换灯泡时间为随机变量，分布为 (0,0.5) 上的 
均匀分布.问在550小时的时候，所有灯泡都己经烧掉的概率（近似 值). 
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9. 设 X 为 r 随机变量，其参数为 （ r», 1). n 应该多大才能满足 
P {\^~ 1 \ > 

10. 工程师认为一座桥 的载荷 W 是一个正态随机变量，其均值为400,标准差 40. 先假定 
车辆的重*为随机变量，均值为3,标准差为 0.3. 约多少辆车在桥上时，可使桥的结构 
遭破坏的概率超过 0.1? (单 位： 1000磅） 

11. 许多人相信公司股票价格的每日涨跌幅是一个随机变量,其期望为0,方差为设 v „ 
为第 n 天的股票价格，则 

y n = Yn - 1 + Xn . n^l 

其中， Xi , X 2 ，…为独立同分布随机变量，期望为0,方差为 er 2 . 现假定今日的股栗价 
格为100,如果 < r a = 1,对于10天以后股栗价格超过105的概率，你有什么结论？ 

12. 一共有 100个元件,有替换地使用，即当元件1失效以后，立刻换上元件2,元件2失效 
后，立刻换上元件3, 等等. 设元件 i 的寿命分布是指数分布，其均值为10 + i /10, « = 
1,2,... ,100,估计总寿命超过1200的概率.如果这些寿命的分布为 （0,20 + i /5) 上的 
均匀分布 , i = 1,2,". ,100,重算上述概率. 

13. 某教师给学生评分的均值为74,标准差为 14. 现该教师对两个班进行测验，一个班有 
25人，另一个班有64人. 

( a ) 估计在25人的班中平均成绩超过80分的概率（近似值) • 

( b ) 对于64人的班，重复⑷的计算 ：• 

( c ) 估计大班的平均成绩超过小班 2.2 分的槪率. 

( d ) 估计小班的平均成绩超过大班 2.2 分的概率. 

14. 设某元件对某电气系统是-个关键的部件，当该元件失效后应该立即换上•个新的元件 • 
假定该元件的平均寿命为100,标准差 30( 小时)，应该有多少备件，才能以0_95以上的 
概率保证这个系统连续运行2000小时？ 

15. —个保险公司有10 000个汽车投保人，每个投保人索赔的期望值为280美元，标准差 
为800美元.求总索赔超过2 700 000美元的概率. 

16. A . J . 需要处理20个文件，这些文件的处理时间是独立同分布的随机变量序列，均值为 
50分钟，标准差为10分钟 • M . J ■也有20个文件要处理，他处理的时间也是独立同分 
布的随机变置序列，不过均值为52分钟，标准差为15分钟. 

( a ) 求 A . J . 在900分钟内完成任务的概率. 

( b ) 求 M . J . 在900分钟内完成任务的概率. 

( c ) 计算 A . J . 在 M . J . 之前完成任务的概率 - 

17. 在下列假定下重做例 5 b : 男女成对的数目是近似正态的.这个假定是否 合理？ 

18. 在习题 2( a ) 中进一步假定学生成绩的方差为25,重做该习鹿. 

19. 一个 湖中有4种鱼，假定抓起来的鱼属于任- 种 的可能性都是相同的，记7为每一种 
鱼至少抓住一条时所需抓鱼的总条数. 

( a ) 找一个区间 ( a , 6), 使得 P{a < y < 6} ^ 0.90. 

( b ) 利用单边的切比雪夫不等式，求出所需抓的鱼的条数使得至少以以上的把握 
保证4种鱼 抓全. 



20 . 设； C 为非负随机变量，其期望为 25. 关于下列的童，我们会有什么结论？ 

⑷ £[ X 3 ]; ( b ) E [ VX }; ( c ) £[ lnX ] ； ( d ) E [ e - X ). 

21. 设 A ■为非负随机变量，证明 

(£[X 2 ]) 1/a ^ (£[X 3 ]) 1/3 < ••• 

22. 设在例 5 f 中投资者也可以将 100 a %(0 < a < 1) 的资产投入一个有风险的计划，而将 
100(1 - a )% 的財产投入无风险的计划，例 5 f 的结论会有什么改变？ | 当她的资产是这 
样被分割时，其投资回报是 fl=aX + ( l - a ) m .] 

23. 设； f 为泊松随机变量，其均值为 20. 

( a ) 利用马尔可夫不等式求出 p = P { X ^26] 的一个上界 • 

( b ) 利用单边切比雪夫不等式求出 p 的一个上界 • 

( c ) 利用切尔诺夫界得到 p 的一个上界 • 

( d ) 利用中心极限定理求 p 的近似值. 

( e ) 利用程序求 p 的近似值 • 


理论习题 

1. 设 X 具有方差 <7 2 ,则 <7称为； C 的标准差•若 X 具有均值 / i 和标准差 tr , 指出 

2 . 设； C 具有期望 M 和标准差 a . 则比值 r 5 \ n \/ a 称为太的测 量的信 噪比.其思想来源 
于； f 可写成其中 m 为信号部分,为噪音部分•定义 |( X - M )// i | = D 
为 X 与 的相对偏差，指出，对于 a > 0 

3. 计算下列随机变量的信噪比，即计算 |/ i |/« r , 其中 M = E [ X ], a 2 = Var ( X ). 

( a ) 泊松随机变量，其均值为 A . ( b ) 二项随机变*,其#数为 ( n , p ). ( c ) 具有几何 
分布的随机变最，其均值为 1/ p . 

( d ) 在 ( a , 6) 上均匀随机 变量. （ e ) 指数随机变量，其均值为 1/ A _ ( f ) 正态随机变量， 
参数为 ( n , a 3 ). 

4. 设多1是一个随机变量序列， c 是- 个 常数，使得对每-个 e > 0,当 n — do 时， 
P {\ Z n - c | > e } -* 0. 指出对任何有界连续函数9,有 

E \ 3 ( Zn )\ -» p(c) n-*oo 

5. 设 /(*) 为（0, 1] 上定义的连续函数，考虑函数 

(称为伯恩斯坦多项式）证明 

^ liin ^ B n ( x ) = /( i ) 
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提 示：设 X u Xi ， … 为独立同分布的伯努利随机变量，其公共均值为 a :, 利用 

和理论习题4,也可证明 B n ( x ) 一致地趋向于 /(*), 这就提供了分析中著名的魏尔斯特 
拉斯定理的概率证明，这个定理说明连续函数可用多项式一致通近. 

6. ( a ) 令 X 为离散随机变量，它的可能值为 1,2,.-. •若 P{X = fc } 为非增序列 ， fc = 

以 …，证 W 則 

( b ) 设 X 为非负随机变量且具有非增的密度函数，指出 

/( x )^ ^ E [ X ] 对一切 I > 0 

7. 掷一枚均匀的《子共100次.记为第 i 次的结果，计算 

P {lI Xl ^® 100 } l<a<6 

的近似值. 

8. 参数为 （ t , A ) 的 r 随机变量，当 t 很大时近似于正态分布，解释这一结论. 

9. 掷一枚均匀的硬币1000次.若前100次都是正面朝上，你认为后面的900次正面朝上 
的比例是多少？ 

10 .设； f 是一个泊松随机变童，其均值为 A . 措出对于 i < A , 


5 t< 

11. 设 X 为二项随机变*，其参数为 ( n , p ). 指出，对于 i > np , 

( a ) e - M E [ e tx ] 当 t 满足 e * = *(1 - p )/[( n - t ) p ] 时达到最小值（此处限定 t > 0). 

( b ) P{X ^^ n - iP ^ l - p )"-*. 

12. 关于标准正态随机变量的切尔诺夫界为 


P{Z > a }^ 


-« a /a 


a > 0 


指出，利用 Z 的密度函数的形式，可将上界压缩成 

P{Z > a } < ie _a2/a a > 0 

13. 若随机变量 X 满足 E [ X ] < 0,同时存在0 / 0,使得= 1，指出这个0必须满 
足》>0. 


自检习题 

1. 在某特许经销商那里，每周汽车销售 置是- •个随机变*,其期望值为16,求下列事件的 
概率的 上界： 

( a ) 下周销售量超过18 辆； （ b ) 下周销售量超过25辆. 

2. 假定自检习題1中汽车周销售置的方差为 9. 

( a ) 给出下周销售量在11到22之间（含11和 22) 的概率的下界 • 

( b ) 给出下周销售置超过18的概率的上界. 
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3. 设 B [ X ] = 75, E \ Y \ = 75, Var ( X ) = 10, Var ( y ) = 12, Cov ( X , V ) = -3. 给出下列概率 
的 上界： 

( a ) P{\X - Y \> 15 }s ( b ) P { X > y +15 }i ( c ) P{Y > X + 15}. 

4. 设工厂 A 每日生产童的期望为 20 个单位，标准差为 3. 工厂 B 每日生产量的期望为 
18个单位，标准差为 6. 假定两个厂的日产量是相互独立的，求出今日 B 比 A 产量多 
的概率的上界. 

5. 设某种元件的寿命（单位 ：天） 的密度函数为 

/(*) = 2 x 0 <x <1 

当元件失效后，立即用新的元件替换.用表示第 i 个元件的寿命， s „ = E ；* =1 Xi 表 
示第 n 个元件的失效时刻，失效率定义 如下： 



假设兄,£>1相互独立,求出 r . 

6. 在自检习题5中，为了以90%的把握维持运行35天，需要准备多少元件？ 

7. 机修厂修理机器需2个阶段，第一阶段所需时间为指数分布，期望为 0.2 个小时.第二 
阶段所需时间也是指数分布，并且与第一阶段独立，期望为 0.3 小时.现在修理工有20 
台机器需要修理，求出他在8小时内完成修理任务的概率的近似值. 

8. 有 -• 种赌博游戏，每次赌博以 0.7 的概率输1元，以 0.2 的概率输2元，以 0.1 的概率 
贏10元.求出该赌徒在前100次赌博后输的概率的近似值. 

9. 在自检习埋7中，确定时间 t , 使得在时间 t 内完成20台机器的修理的概率约为 0.95. 

10. 烟草公司宣称一枝香烟中尼古丁含置的均值为 2.2 mg , 标准差为 0.3 mg . 但实测100支 

香烟中，尼古丁含量的均值为 3.1 mg , 现在假定烟草公司的说法是对的，问100支香烟 
中尼古丁含量均值高于 3.1 mg 的概率为多少？ 

11. .- 共有40节电池，每-节电池可能是类型 A 或类型 B , 是 A 或者 B 的概率是相等的 
类型 A 的寿命均值为50,标准差为15,类型 B 的寿命均值为30,标准差为 6. 

( a ) 求出40节电池的总寿命超过1700的槪率（近似值) • 

( b ) 假定己知20节电池为 A 型，20节电池为 B 型，现在求总寿命超过1700的概率的 
近似值. 

12. 诊 所每天的志愿医生的人数是-个随机变量，取值为 2,3,4. 并且这三种情况是等可 
能的.不管当天来了多少志愿者，毎位志應者所看的病人数为泊松随机变量，期望为 30. 
记 X 为当天由志愿者所看的病人数. 

( a ) 求 £【 X 】.（ b ) 求 Var ( X ). ( c ) 求 P{X > 65} 的近似值（利用正态分布表). 

13. 强大数律指出，独立同分布的随机变量序列的前 n 项的算术平均以概率为 1 地收敛到 
他们的公共期望值.现在的问题 是：前 n 项的几何平均收敛到什么？即 

n 1 ™ (n x 0 1/n=? 



第 9 章概率论的其他课题 

9.1 泊松过程 


在定义泊松过程以前，我们把/ I 的函数/(/ I )称为 0 (/ i ) 的定义叙述一下 ./ 称 
为0(/1)，如果它满足 

fc — 0 h 

f 为 o ( h ) 是指当 ft — 0 的过程中， / 的值比起 h 来,还要小得多.现在假定在时间 
轴上的一些随机点上发生了若干事件 '记 N ⑴在时间区间 [0, 上发生的事件的 
个数，随机变量集合称为具有速率 A 的泊松过程 （A > 0) ，如果 

( i ) N {0) = 0. 

( ii ) 在不相交的时间段内发生的事件数是相互独立的. 

( iii ) 在给定时间区间上发生的事件数的分布只跟时间区间的长度有关，而与 
这个区间的位置无关. 

( iv ) P { N ( h ) = l } = Xh + o { h ). 

( v ) P { N ( h ) > 2} = o { h ). 

条件⑴只说明这个过程在 t = 0 处开始，并且 N (0) = 0. 条件 （ ii ) 是独立 
增量假设，例如，在 t 以前发生的事件数（即 JV ⑴）与在区间 ( t,t + s ) 内的事件 
数（即 N(t + s )~ N ( t )) 是相互独立的随机变量 •条件 （ iii ) 是平稳增量假定，即 
N{t + s )~ N ( t ) 的分布与 t 无关. 

在第4章，基于泊松分布为二项分布的极限这一结论,推导出 N ( t ) 具有泊松 
分布，其参数为 At . 此处我们也要导出这一结果，但方法稍有不同. 


引理 1.1 对于速率为 A 的泊松过程， 

P { N { t ) = 0} = e _At 


证 明：记 凡⑴= P{N{t) = 0}, 我们由下式导出一个微分方程. 

P 0 {t + /») = P{N(t + h) = 0} = P{N(t) = 0,N(t + /»)- N{t) = 0} 

= P{N{t) = 0}P{N(t + h)~ N(t) = 0} = Po(0(l -从 + o{h)] 

①此处的亊件与前面讨论的具有概率的随机亊件有所区别，在“随机点上发生的事件’•都是零概率事 
件，有的作者称其为“随机点 h 发生的呼唤”.——译者注 
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上式中倒数第二个等式是独立性条件 （ ii ) 的结果，而最后一个等式利用了 （ iv ) 和 
( v ). 因此 


p o(t + h)~ P 0 {t) 、 w、. 0 ⑻ 

- ^ -= 一聯 )+ 了 

Po(t) = -入 P 0 ⑴ 

碰 一 A 


再令 h — 0 ， 得 
或等价地 
将上式积分，得 
或 

忾⑴ = Ke- Xt 

再利用抒⑼= P { N (0) = 0} = 1,我们得到 

祚⑴= e ~ At . 


丽 
InPoW = —At 


对于一个泊松过程，用7\表示第一个事件的发生时间，对于 n > 1,记： r „ 为 
第 71- 1个事件点到第 n 个事件点的时间间隔，序列 { T„,n = 1,2 - }称为泊松 
过程的时间间隔序列.例如，乃= 5, T 2 = 10表示泊松过程第一个事件发生在时刻 
« = 5,第二个事件发生在时刻 f = 15. 

现在我们要确定 T „ 的分布.首先我们指出，随机事件 { T , > t } 发生的充要条 
件是泊松过程在丨 0 J 内事件发生的个数为0,因此 

P{Ti > t } = P { N ( t ) = 0} = e~ M 
即: n 具有指数分布，其均值为 i / a . 现在计算 

P{Tt > t } = E [ P { T t > t | T ,}] 

但 

P { T 2 > t\Ti = s } = P{(«,s +1] 上有 0 个事件发生 = s } 

= P {( s,s + 上有 0 个事件发生 } = 

上式中第二个等式是由独立性所得,而第三个等式是由泊松过程的平稳性所得•由 
上式可以得到两个结论，: r 2 也具有指数分布，其期望值为 i / a . 同时 r 2 与7\相互 
独立,重复上述推论过程可得命题 l . i . 


命题 1.1 速率为 a 的泊松过程的时间间隔序列为独立同分布序列，其公 
共分布为指数分布，公共期望为 i /入. 


与泊松过程有关的另一个重要的量为，第 n 个事件发生的时刻，或者称第 
n 个事件的到达时刻（等待时间)，这个名词来源于服务系统的顾客到达时刻（或系 
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统的等待时间).易知， 


因此，由命题 ] 
概率密度为 


S n = y ^ Tj n > 1 

i=l 

.和第5章 6.1 节知，具有 r 分布，其参数为 （ n , A ). 即 S n 的 

-Ax 


/Sn(*) = 入 e - 入 


(n-1)! 


E^O 


现在我们可以证明 N ( t ) 是一个泊松随机变量，其均值为 


定理 1.1 对于一个速率为 A 的泊松过程， 


P{iV ⑴ = n} = 


- At ( Af) n 

n ! 


= 0 , 1 , 2 ,- 


证明: 注意到第 n 个事件在 f 或 t 以前发生的充要条件是在 f 以前至少发生 
了 n 个事件，即 

N ( t ) ^ n <^ S n K：t 
故 

P { N ( t ) = n }= P { N ( t ) > n }~ P { N ( t ) > n + 1} = P { S n P { S n +i < t } 


X (Ax)"- 


Ae -^ 


( Ax )" 


(«_ D ! 

利用分部积分公式 fudv =uv — f v du , 其中 u = e -A *,dw = A (( A®) n-1 /(n — l )!] da : 

由此可得定理之 结论. 口 


9.2 马尔可夫链 

考虑随机变量序列 X 0 ,x 1 ,- -, 假定这些随机变量的可能取值的集合为 { 0 , 
1,... , M }. 通常可将解释为系统在时刻 n 的状态.因此，当= i 时我 
们就说这个系统在时刻 n 处于状态 i . 随机变量序列称为马尔可夫链，如果某时刻 
处于状态 i , 且存在固定的概率使得下一时刻以概率尸0处于 状态夂 即对所 
有 *0,' •' 

P { X n +i = j \ X n = *, X n -i = tn-li • ■' ,- X^l = *1,^0 = * o } = Pij 
值 Py ,0 < i < M ,0 < < M 称为马尔可夫链的转移 概率. 它们满足（为什么？） 

M 

Pij^O 5^ = 1 t = 0, l ,- - ,M 

J=0 
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可将 Py 排成如下一个 方阵： 

Poo Poi … Pom 

Pio Pn … P\m 

Pmo Pmi … Pmm 
这样的方阵称为转移概率矩阵. 

有了转移概率阵和 ATo 的初始分布，我们就可以计算所有有关的 概率. 例如， 
X 0 , …， X n 的联合分布列可由下列方式得到 
P { X n = in , X n -1 - in - 1 ，• • • , Xi = * 1 , Xo = to } 

= P { X n = t n | X„_i = tn-ii - • - ,Xo = to } P { X„_i = i n - i , … ,Xo ― io } 

= Pi K - i , i „ P { X n -i = i „_ i, … ,Xo = to } 

继续这个步骤，最后，得到这个概率等于 

••- PiiM P io.ii P { X 0 = *o}- 

例 2 a 假设明天是否下雨只决定于今天是否下雨.又假定，若今天下雨，则明 
天下雨的概率为 a , 若今天不下雨，则明天下雨的概率为 /?• 若用状态0表示下雨， 
状态1表示不下雨.这样，天气系统成为一个两个状态的马尔可夫链，其转移概率 

矩阵为 II II 

It ：：:! 

即 Poo = a = 1 — ftiI Pio = = 1 — Pn - ■ 

例 2 b —赌徒在赌博的时候，每赌一局或者贏一个单位，贏的概率为 P , 或输 
—个单位,输的概率为1 _ p . 当赌徒的赌本为0或 M 时，则赌博 停止. 此时，赌徒 
的赌本是一个马尔可夫链，其转移概率为 

Pi , i +1 = p = 1 - i = 1，…， M - 1 

Poo = Pmm = 1 

例 2 c P . 埃伦费斯特和 T . 埃伦费斯特是两位物理学家（又是夫妇)，他们提 
出了一个分子运动的理论模型.设有两个坛子，里面共有 M 个分子,每一次随机地 
选择一个分子，把它从原来的坛子移向另一个坛子，记表示第1个坛子经过 n 
次转移以后的分子的个数•则{知,&，•..}是一个马尔可夫链,其转移概率为 
M — i 

Pi , i + i = ^ O ^ i^M 

= jjj 0 < i < M 

Pii = 0 若 ■ 
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对于马尔可夫链，表示由状态 i 转入）的概率，我们也可以定义两步转移 
的概率 P ^\ 它等于一个系统原来在状态 i , 经过两步转移以后到达状态 j 的概率. 
即： 

PiP = P { X m +2 = j \ X m = t } 

可以由 只, 经过下列方式计算得到 

M 

4 2) = p { X ^= j \ X ° = 0 = E P {^2= j , X 1 = k\Xo = i } 

k —0 

M M 

=Y, P { X 2 = j\Xt = k , X 0 = i } P{Xx = k \ X 0 = i} = 5Z PkjPik 

k =0 k =0 

一般情况下，可求出 n 步转移概率 P ^\ 

Pj ^ ) = P { X n+m = j \ X m = i } 

为计算 if ), 我们引入下列命题. 

命題 2.1 (査普曼科尔莫戈罗夫方程） 

^ n ) = E 4 r ) ^ r r) °< r < n 

fc -0 

证明： 

P ^ = P { x n = j \ X 0 = t } = 5] P { X n = j,Xr = k \ Xo = i ) 

k 

= 53 P { X n = j \ X r = k , X 0 = i } P { X r = k \ X 0 = i } = E Hr r)P P D 

k * 

例 2 d ( 随机游动）随机游动是一个可数无限状态空间中的马尔可 夫链. 假定 
状态空间是{0,±1, - }.当质点处于状态 i 时，它下一步会以 P 的概率往右移一 
步，以 1- P 的概率往左一步.这样，质点的路径形成一个马尔可夫链，其转移概率 
为 

Pi , i+i = p = 1 - Pi , i-i i = 0，± l ,... 

现在设一个质点处于状态 i , 若它经过 n 步转移以后到达状态那么，其中 （n - 
i + j )/2 步是往右的,而7! - (n - i + j )/2 = (n + t - j )/2 步是往 左的. 每一步往右 
的概率为 P , 并且独立于其他各步，它恰好是一个二项概率， 

上式中二项系数当 a : 不是小于或等于 n 的非负整数时，定义为 0. 上述公式 
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可以重新写成 

Pi? + 2 k = („ 2 " Jp n+fc (l - P) n ~ k k = 0,±l,-.,±n 

= { n 2 +kl i)p n+k+1 ^ - P)" _fc * = 0,± l ,..-,± n,-(n + l ) ■ 
虽然 /^ n ) 是条件概率，但是我们可以利用初始概率，导出相应的无条件概率, 

例如 

P{Xn = = ^ p i x ^= j\Xo = i}P{X 0 = i} = 534 n) P{X 0 = i} 

i i 

对于很大一部分的马尔可夫链， G ? 0 收敛到--个数& ,它不依赖于初始状态可 
以指出，具有这种性质的一个充分条 件是： 存在 n , n > 0,使得 

> 0 对所有的 （j = 0,1,…， A / (2.1) 

满足公式 (2.1) 的马尔可夫链称为遍历的，由命题 2.1 可得 

i ，( n + D = ^ p ( n )pfc . 

fc =0 

上式中令 n — oo , 对于遍历的马尔可夫链，可得 

M 

= y^.^kPkj (2.2) 

fc =0 

利用恒等式1 = 5：；^ fg 0 , 令 n -» oo , 可得 



事实上，可以证明^-,0< j < M 是方程组 (2.2),(2.3) 的唯 一解. 所有这些结论，可 
综合成下面的一条定理，但是此处没有给出证明. 


定理 2.1 对于遍历的马尔可夫链， 

7Tj = lim 

存在，并且 7 r jt 0 是下列方的唯 一解： 

M M 

^j = ^2^kPkj 52 ^ = 1 


例 2 e 考虑例 2 a ， 我们假定如果今天下雨，则明天下雨的概率为如果今天 
不下雨,则明天下雨的概 率为久 由定理 2.1, 下雨和不下雨的极限概率 7 t 0 和 m 由 
下面的方程组给出 
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7T0 = ano + 01Tl 7T1 = (1 — a)lTo + (1 — /3)7 Ti 7ro + 7Tl = 1 

由这个方程组得到 

0 1 — a 

^ 0= l+/3-a ffl= l + /?- a 

例如 , a = 0.6,13 = 0.3, 则下雨的极限概率为 tt 0 = 3/7. ■ 

当 n 很大时，童~也等于马尔可夫链处于状态 j 所占的时刻的比例，= 
0,1,…， M . 直观上可以这样地看这一事实 ：记巧 表示当 n 很大时，链处于状态 j 
的时刻所占的比例.（利用强大数定律可以证明，对于遍历的马尔可夫链,这个比例 
的极限存在，并且是一常数 .） 现在设链处于状态 it 的比例为/ V 由于由转向 j 
的概率为这样，这个链中，由 Jb 转向的比例为巧_心，对所有状态*求和， 
ZkPkPki 就是链处于状态 j 的比例.这样，处于状态 j 的时刻的比例应满足 

Pj = ' EPkPk j 

k 

同时下式是明显成立的 

E 巧 =i 

再利用定理 2.1, &是方程(2.2)(2.3)的唯 一解. 可推知 Pm,j = 0,1,••- , M . itj 
处于状态 j 的时刻的比例的解释，即使是非遍历的马尔可夫链也是正确的. 

例 2 f 现在我们再考虑例 2 c , 假设我们感兴趣于恰好有 j 个分子在第一个盒 
子中的时刻的比例 , i = 根据刚才的讨论,恰好有 j 个分子在第一个盒 

子就是马尔可夫链处于状态 j • 因此，所问的问题就是马尔可夫链处于状态 j 的时 
刻的比例问题.利用定理 2 . 1 , 可化为求解方程组 

no = iriX j 4 

M — j +1 J +1 . 

7Tj = 1Tj-i X --- + 1tj+l X J = \, ■■- 

1 

X — 

M 

i=o 

易知，这组方程组的解为 

巧 = 3 = 0 , 

这些就是马尔可夫链保持在状态 j 的时刻所占的比例.（习题11给出了一个如何 
估算前面问理的解的方法 .） ■ 
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9.3 惊奇、不确定性及熵 

考虑在试验中事件£；发生以后的情况.当你知道一个 事件五 发生以后，一定 
会有某种惊奇的感觉，不过惊奇的程度可大可小.这种惊奇是由于事件 S 发生所 
带来的信息所引起的，而这些信息又与事件 E 的概率有关.我们还是用例子来说 
明.设某人掷敢子，当人们听到两个骰子的总和是一个偶数时，并不感到十分惊奇 
(该事件的概率为 1/2). 但是当他掷出总和为12时，就感到惊奇了，原因是“和为 
12” 这个事件出现的概率为 1/36. 

本节中，我们要将惊奇童化，首先我们必须有这样一个共识，当知道某事件发 
生以后，感到惊奇的程度只跟这个事件的概率有关.我们用表示由概率为 p 
的事件发生以后所产生的惊奇感觉的程度.为了确定 S ( p ) 的具体形式，我们需要 
给出 S ( p ) 应该满足的条件，根据这些条件确定 S ’( p ) 的形式.首先我们假定 S ( p ) 
对一切0 < p < 1有定义,但对于概率为0的事件没有定义. 

关于惊奇的第一个条 件是： 当听到一个必然亊件发生时不会产生任何惊奇.因 
此 


公理 1 5(1) = 0. 


第二个条件是越不容易发生的事件发生后，造成的惊奇感觉就越大. 


公理2 S ( p ) 是 p 的严格递减函数，若 p < 9,则 5( p )> S ( q ). 


第三个条件是数学上的条件, p 的微小变动也会导致的微小变动. 


公理3 是一个 p 的连续函数. 


现在考虑两个独立事件£；，假定 P(E) = p , P{F) = q, P{EF) = pq. 因此，当 
听到 E,F 发生时，相应的惊奇为 S(pq). 现在假定£首先发生，然后 F 发生.而 
5( p ) 表示听到£发生后的惊奇，由此可知 S(pq)-S{p) 表示听到 F 发生以后的附 
加的惊奇. 由于尽 f 相互独立,的发生并不影响 F 的概率，因此，这部分附加的 
惊奇应该是 S(q). 这样，我们有 


公理4 S ( pq ) = S ( jp ) + 5( q ) 0< p < l , 0< g<l 


现在我们要给出的表达式. 
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定理 3.1 若 5(.) 满足公理 1 〜 4, 则 S ( p ) = - Clog 2 p , 其中 C 为任意正 
数. 


证明： 由公理4,知 

S ( p 2 ) = S { p ) + S ( p ) = 2 S ( p ) 


由此,利用归纳法得 

S ( p m ) = mS ( p ) 

(3.1) 

同时，对任何正整数 n , 5( p ) = 5 (pi •-. 〆 ）= nS ( pn ), 由此推得 



5( p ») = ^ S ( p ) 

(3.2) 

由式（3.1)， （3.2) 知 

S ( p m 卜) = mS ( p -) = ^5( p ). 


或者 

S ( P *) = xS ( p ) 

(3.3) 


其中: c 为正有理数，但由于 S 为 p 的连续函数（公理 3), (3.3) 式对于非负实数都 
成立. （证明此结论!) . 

现在，对任意 p ，(0 < p < 1), 令 I = - logjp , 或 p = (1/2)* ，由 (3.3) 式得 

s ( p ) = ) = : 5 (士) = - cl °feP 

其中 C = S ( b >5( l ) = 0. □ 

当 C 7 = 1 时, S ( p ) = - log 2 ( p ), 其单位为比特(5(|)). 

现在考虑一个随机变量，它的可能取值为 XI ,••- , xn , 相应概率为 Pi , ••- , Pn - 
当观察到 A 以后，引起的惊奇为 _ log 2 ( Pi ), 由此可知，当观察到随机变置 A ： 所引 
起的平均的惊奇为 „ 

H { X ) = - pi log 2 pj 

iml 

在信息论中 H ( X ) 称为随机变董 X 的熵（当 Pi = 0时， OlogJO ) = 0). 可以证明， 
当 Pi 相同时， H ( X ) 达到其最大值. 

H ( X ) 表示得知 X 值以后所引起的平均惊奇程度,但也可以认为 X 的不确定 
程度，事实上，在信息理论中， H { X ) 就是观测到 X 的值以后所接收的平均信息量， 
因此，惊奇程度，不确定性和信息量是从不同角度来看待 X 的同—个特性 • 

现在考虑两个随机变量 A ■和 y , 它们分别取值于 X ! ，■ - , X n 和奶，… ， l / n ， 
其联合分布列为 

p (, Xi , yj ) = P{X = x it Y = yj } 

随机向量 (X,y) 所含的不确定性为 




9.3 俅奇、不确定性及熇 387 


H ( x ， y ) = ~H Ep (: “ 10.) log2P(x»,y,) 

» i 

设 F =的己观测到，此时 A ■在 y = 珩 的条件下的不确定性为 
H Y= Vj {X)~- ^p(xi|yj) \og 2 P{. x i\yj) 

其中 

P( x i\Vj) = p {^ = Xi\Y = yj) 

因此，当 y 被观测到以后 ，x 的平均不确定性为 

HY(X) = J 2 H Y=yj WpY(yi) 

其中 Pv{Vi) = P{Y = io). 


命题 3.1 说明了 与 H(Y),Hy(X) 之间的关系. X,Y 的不确定性等 

于 y 的不确定性加上 y 被观测到以后X的平均剩余不确定性. 



证明：利用恒等式 p(xi,yj) = PY(yj)p{xi\yj), 


H(X,Y) = -^^pixuVj) log 2 p(n, yj) 

* i 

= ~Yl Y^PY{yj)p{xi\yj)Wog 2 pY(yi) + loguPkb )】 

= -^ 2 pY(Vj) log 2 PY(yj ) 51 p(*< \Vj ) 

3 1 

- Epy(i/j) EpN 的 ) l °f>2P{xi\Vj) 

3 i 

=H(Y) + H y {X) □ 


当 F 被观测到以后, X 的不确定性应该减少，这是信息论的一个基本结果.为 
证明这个结论，我们需要下面的引理（证明作为习 题)： 
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证明： 

Hy(X) - H{X) = - 5Z52p(Xi|yj) logjlpCxilyjOlpCyj) + Z J^pOc *， ％) log 2 p(x<) 

« j i i 

= ^ P ^ ) l ° e 4 ^)] 

^ log 2 eJ2 ^ 2p ( xi , yj ) [p^^) - x ] 利用引理 3.1 

=log 2 e [ 5 Zp(ii)P(Wi) - E〆 1 * ， 吣） 

■ i i i i 

=log 2 e[l — 1 ] = 0 □ 

9.4 编码定理及熵 

设一离散随机变量X在 A 地被观测到，然后通过一个通讯网络送到 B 处，而 
通讯网络信号由0和1组成.为了实现通讯的目的，我们必须把X的可能值编成 
—个一个的0 - 1 序列. 为了避免混乱，要求编码后的序列，不能出现一个序列是 
另一个序列的延长. 

例如，X可取 Xl ,x a ,x 3 ,x 4 , 则一个可能的编码方式是 

ii *-* 00 xj «-* 01 ®3 10 X4 11 (4-1) 

若 X = A ，则将 00 送到 B 处，若 X = a: 2 , 则将 01 送到 B 处， 等等. 这就形成一 
个编码 系统. 另一种可能的编码方式是 

Xi 0 X2 *-* 10 X3 <-♦ 110 14 HI (4-2) 

但是下面的编码是不容 许的： 

®! +-» 0 12 1 13 «-* 00 X4 *-* 01 

这是因为00是0的延长，01也是0的延长 • 

编码理论中的一个任务是设计一个编码系统，使得在传送过程中具有最小的期 
望码长.例如，若 

p{X = xi} = i P{X = x 2 } = ^ P{X = 13} = g P{x = 14} = g 

若利用 （4.2) 传递，则平均码长为-.1 + 4.2+|.3 + 1.3 = 1.75,若用 （4.1) 传递， 
则平均码长为2,因此，对于上面一组概率，（ 4 .2)比 （4.1) 更有效 • 

现在提出这样的问题，对于给定的随机变量，什么样的编码系统是最有效？其 
结果是这样的，对于任何编码系统，其平均码长大于或等于X的俄，这个结果就是 
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信息论中的无嗓声编码定理，为证明此结果，我们需要下面的引理 4.1. 


引理 4.1® 设 X 的取值范围为 x w -； x N . 为了把它们编成长度为 m , - -, 
n N 的二进序列（不能让其中一个序列为另一个序列的延长)，充要条件为 


证明： 对于正整数 m ，… ，⑽ ，记％ 表示 Th 中等于 j 的个数 ， j = 1,2,…. 
为了使得它们形成编码系统，显然，< 2,又由于不容许一个码为另一个码的延 
长对于奶，必须满足 w 2 ^2 2 -2 w u 其中2 2 是码长为2的所有二进序列个数，而 
2w, 就是将长度为1的序列延长成2位序列的个数.一般情况下据相同的理由， 
应满足 

«>„ < 2 n - «； i 2 n_1 - u ^2 n-3 - w n - i 2 n = 1，2,… (4.3) 

事实上，仔细一想，若有一组 = -, N , 满足上述条件，就可能找到相应的 

二进序列将 A 进行编码，并且而相应的码长为 n <， 因此, (4.3) 是将 : cw ,0^编 
成码长为的编码系统的充要条件. 

将 (4.3) 改写成 

w n + w n -i2 + • •. + u»i2 n— 1 ^ 2 n n = 1,2, ••- 
两边除以2"，充要条件变成 

^ 1 对一切 n 成立 (4.4) 

j.=i 、/ 

由于 n 为任意的，容易看出，这个充要条件变成 

j-i ' / 

由于％是 ni ，...， n w 中等于 J _ 的个数，于是 

§普撕 ° 

现在给出定理 4.1 


定理 4.1( 无噪声编码定理）设 X 取值于 { ii , ••- , x W }, 其相应的概率为 
p ( xi ),---, p ( x W )- 设有一个编码系统，将 A 编成叫 位的二进序列，则 

N N 

y ^ riip ( xi ) > H ( X ) = - y ^ p ( xj ) log 2 p ( j «) 


①在本章末，译者给出该引理的另一种证明.——编者注 
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证 明：记 Pi =?(**), 9i = 2-"*/ EjL , 2-" i , i = l , • • • , AT . 关于这两组数，我们有 

-gfilog 2 ③ =—log 2 eL 巧 In ( 尝 )=log 2 eE 巧 & ( 鸯） 

^ logjefjPi ^- l ) 利用引理 3.1 

N N 

= 0 由于 gi = 1 

«=1 i=l 

由此可得 

N N N , N •. 

~Yl Pi l0g 2 ~ 5Z Pi 1<5g 2 * = 5Z U<P< + l0g 2 ( 5Z 2 ~ n> ) 

i=l i=l t=l ) 

N 

彡巧 利用引理 4.1 □ 

t=l 

这个不等式即定理之结论. 

例 4 a 考虑随机变童 X ,其分布列为 

p(*l) = \ p(*2) = | P(*3) = p(*4) = ^ 

由于 



现在考虑编码 

XI «-► 0 X 2 10 13 <-► 110 14 111 (4.5) 


对于这组编码，平均码长为 En i "< P ( a ： i ) = l -75 = H ( X ). 由定理 4 .1 知，不会再有 
比这一组编码更有效的编码了/ ■ 

对于大部分随机变量来说，不会存在一组编码系统，使得平均码长达到下界 
H ( X ). 但是可以存在一个编码系统，使得平均码长与 H ( X ) 之间的误差小于1•为 
此 ，记％ 为满足下列条件的整数 

一 log 2 p(xi) ^rii<- log 2 p(xi) + 1 


由于 

N N N 

^2 _ni < Y ^^ Xo%7P(Xi) = i 

i=l i=l <=1 

利用引理 4.1, 我们能够构造一组编码 (0-1 序列)，使得其长度为 n*(i = N ), 

m 对应于而.此时,这组编码的平均长度为 i = EHi rnp ( xi ). 显然 L 满足 

N N 

- 5Zp ㈤ log 2 p(ii) (L<- 53p(i<) log 2 p(a ： i) + 1 




或 
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H ( X ) < L < H { X ) + 1 


例 4 b 现独立抛掷10次硬币，每次正面朝上的概率为 p , 现在要把这个信息 
由 A 端送 B 端.试验的结果为 X = ( Xj . Xa , - - , X 10 ), 其中 


Xi 


第 i 次抛掷正面朝上 
第 i 次抛掷反面朝上 


根据刚才得到的结果，必定存在至少一个编码系统，具平均码长 L 满足 


H ( X ) H ( X ) + 1. 

由于为相互独立的随机变量，依命题 3.1 和定理 3.2, 得 

N 

H ( X ) = H ( X U ••- ,X„) = 53 H ( Xi ) = -10[plog 2 p + (l-p)log 2 (l-p)] 

i=l 

设 p = 1/2, 则 H ( X ) = 10, 此时，利用 X = a ; 作为编码系统，其平均码长为 
10. 因此,不会存在比 X = x 本身这个编码系统更有效的编码系统.例如，前5次 
掷硬币，得到正面朝上，后5次反面朝上，可将1111100000直接进行传送 • 

然而，当 p / 1/2,我们可以找到一组编码，使得平均码长比10 小. 例如 p = 1/4, 

此时 o o 

H ( X ) = -10(ilog 2 i + jlog 2 ?)=8.11 

我们可以找到一组编码，其平均码长小于 911. 

一个简单做法如下，将 { X ly ■■- , X W ) 分成5对，2个随机变量形成一对，编码 
方法 如下： 

Xi = T , X <+ i = T 0 Xi = T , X i+ i = H 10 

Xi = H , X i+ i = T «-» 110 X 4 = H , X i+1 = H — 111 
此处 , i = 1,3,5,7,9, H 表示正面朝上, T 表示反面 朝上. 这样可把10次掷硬币结 
果通过一对一对的编码将信号传送出去. 

例如，试验结果为 TTTHHTTTTH , 此时编码为010110010,其平均码长为 

5 [ i (i) 2+2 (i)(i) +3 (i)(D + 3 (^m * 844 ■ 

到此为止，我们讨论的传送都是无噪声传送，在 A 端送出一个信号，在 B 端接 
收到的是与 A 端完全相同的 信号. 由于随机干扰，在实际通讯中，往往产生误差， 
例如发送端发送的消息为00101101,而接收收端变成 01101101. 

现在设在发送端发出一位 (0 或1)，在接收端将以概率 P 收到正确的信号，并且 
各位之间的传送是相互独立的，这样的通讯系统称为二进对称通道.现在设通道的 
参数 p = 0.8, 并假设传送的信号由很多位 组成. 由于每位有0. 2 的概率误传,若不 
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经过技术处理而直接传送，这种错误是很严 重的. 一种减少误传信号的方法是将信 
号重复3次，然后在译码过程中按多数原则，即按照下表中方法进行编码和译码. 


编砑 解码 編码 解码 



这种编码的方法，如果传输过程中最多只有一个错误.那么，通过译码,还能轉 
到正确的信号，因此,传送一位错误的概率变成 


(0.2) 3 + 3(0.2) 2 (0.8) = 0.104 

这是一个很大的改善，事实上,只要在编码时，重复足够多次,就可以将误传概 


率变成任意小.例如下面的系统. 

鑲 码 

解 码 

0— 17 个 0 

多数原则 

1 17 个 1 



可将传送一位的误差概率缩成小于 0.01. 

上述编码方法的问题是，虽然把传送误差减少了，但是在通讯过程中，每一位 
传送的信号也相应减少了（见表 9.1). 


表 9.1 重复传«的缠码系统 


毎一 位的误差概車 

传送中毎 一位实 际传送的倌号 

0.20 

0.10 

1 

0.33(= 1/3) 

0.01 

0.06(= 1/17) 


看起来，想要减少误差概率，不可避免地也需降低传送的效率.然而，这个结论 
是不正确的，在信息论中有香农建立的 嗓声编码定理 (noisy coding theorem ), 其结 
果是惊人的，现在我们叙述这个定理. 


定理 4.2( 噪声编码定理）存在一个数 C ， 使得对于任何 R < C , 以及任何 
£>0,存在一个编码译码系统，使得传送一位的误差概率小于 e , 而每一位 
实际传送的信号为 R , 最大的 C 的值 C * 称为通道容量，对于二进对称系 
统， 

C * = l + plog 2 p + ( l - p ) log 2 (l - p ) 


小 结 


具有速率的泊松过程是一族随机变量 { iV ( t ), t ^0}, 它涉及时间轴上的随机 
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点上发生的事件，例如， N ( t ) 表示在时间区间 （0， tj 上发生事件的个数.泊松过程 
由下面几个条件所界定. 

( i ) 在不相重的时间区间上发生的事件数是相互独立的. 

( ii ) 在一个区间内发生事件的个数的分布只依赖于这个区间的长度. 

( Hi ) 在一个时刻只发生一个事件. 

( iv ) 事件发生的速率为 A . 

可以证明 N ( t ) 是泊松随机变童，其期望值为 At . 此外，两个相邻的事件之间的时 
间间隔 7 ；(i > 1) 是独立同分布的指数随机变量，参数为 

取值于{0,1，…， M } 的随机变量序列 { X n , n >0} 称为具有转移概率的 
马尔可夫链,如果对 于一切 n , io ,-•• , i n , i , j , 

P { X n+ i = j \ X n = *, X„_i = * n - l , ••- ,Xo = to } = Pij 
如果我们将解释为时刻 n 的状态，然后马尔可夫链可以解释为一串顺序的状 
态序列，如果某一时刻在状态 i , 下一时刻在状态 j 的概率为它与以前的历史 
相互独立.有许多马尔可夫链，处于状态 j 的概率当 n - oo 时有一个极限概率， 
它不依赖于初始状态，若用- 表示这些概率，它们是下列方程组的唯 

—解： 

M 

^ = ^2 n i P ij J = 0,1, • • • , M 
<=0 
M 

J =1 

进一步, D 也是马尔可夫链当 n 充分大时，处于状态 j 的时刻的比例. 

设 X 是取值于{ I ,, -- ,!„} 的随机变量，其相应的概率为 { Pl ，… ， p „}, 量 

H { X ) = -^Pi log 2 ( p <) 

称为随机变量 X 的熵，它可以解释为 V 具有不确定性的大小，也可以解释为当观 
测到 X 以后所接受的平均信息量.熵在二进制编码理论中有很重要的应用 • 

理论习题 

1. 顾客按照速率为 A 的泊松过程的方式到达一个银行，设在前一个小时内有两位顾客到达， 
求下列事件的 概率： 

( a ) 都在前20分钟内 到达； （ b ) 在前20分钟内至少有一个顾客己经到达. 

2. 假设在高速公路的某处每分钟通过的汽车数是一个泊松随机变童，速率 A = 3辆/分. 
现在设某人不顾一切地要冲过该公路，他走过公路的时间为 s 秒. （假定他在公路上时, 
若刚好有一辆车通过这一路口，则这个人一定会受伤 •） 求他不会受伤的概率.考虑 s = 
2,5,10,20的情况，求出其 概率. 
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3. 假定在习题2中这个人比较机警，在穿越公路这段时间内（时间为 8 秒)，若只有一辆汽 
车通过，他不会受伤.但是，当这段时间内有2辆以上的车经过时，他一定会受伤.求他 
穿越公路时不会受伤的概率，并计算 s = 5,10,20, 30( 秒）时的概率值. 

4. 设一共有3个白球和3个黑球，将它们放在2个坛子里，每个坛子里放3个球.若第一 
个坛子里含 i 个白球，则这个系统处于状态 i,i = 0,1,2, 3. 每一步从两个坛子中各随机 
地拿出一个球,将第一个坛子中的球放回到第二个坛子，将第二个坛子中的球放回到第一 
个坛子.记 X „ 为 n 步以后的状态，计算马尔可夫链 { X „, n >0} 的转移概率. 

B . 在例 2 a 中，假定今天下雨的概率为 0.5, 计算第4天下雨的概率 （a = 0.7,/? = 0.3). 

0. 计算理论习题4中的极限概率. 

7 . 称一个转移概率矩阵为双重随机的，如果它还满足 

Y, Pi i = 1 J' = 0,l,2, -. ,M 

*■0 

如果这个马尔可夫链是遍历的，证明 A = = 0,1,••- , M . 

8. 某人的稍神可能处于3种状态，兴奋 （ c ), 平静⑷，郁闷 （ g ), 下面是精神状态的转移概率 
矩阵： 


c 0.7 0.2 0.1 
s 0.4 0.3 0.3 
g 0.2 0.4 0.4 

这个矩阵是这样解释 的：以 s 行为例，这一行表示若今天他比较平静，那么他明天处于兴 
奋、平静和郁闷的概率分别为 0.4,0.3,0.3. 其余各行的解释是类似的.求这个人处于兴奋 
天数所占的比例. 

9. 假定明天是否下雨只依赖于过去两天的气候状况，特别地，若昨天和今天都下雨，那么明 
天下雨的概率是 0.8; 若昨天下雨，今天不下雨，则明天下雨的概率为 0.3; 如果昨天不下 
雨，今天下雨，则明天下兩的概率为 0.4; 如果昨天和今天都不下雨，则明天下雨的概率为 
0.2. 求下雨天的比例. 

10. —个人每天出去跑步，他出去的时候可从前门出去，也可从后门出去，前门出或后门出是 
等可能的.他回家的时候也是等可能地从前门或后门回来.他一共有5双运动鞋,放在两 
个门的门边，出去的时候随便从门边穿一双出去，回来的时候就把鞋脱在门边.他出去的 
时候如果门边没有鞋，就只好光脚跑步. 

( a ) 建立一个马尔可夫链，给出状态空间和转移概率阵 - 

( b ) 求他光脚跑步次数所占的比例. 

11. 在例 2 f 中， 

( a ) 验证 n , 满足方程组. 

( b ) 对于给定的分子，求出它在第一个盒子里的（极限）概率. 

( c ) 当时间很长以后，事件“第 j 个分子落在第一个盒子中”，是否独立？ 

( d ) 解释为什么 （ b ) 中极限概率是这样的. 

12. 设某人掷两枚均匀敢子，并计算所得点数之和，求这个和数 的熵- 
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13. 设 X 取 n 个值，其相应的概率为 Pi , -- ， P „, 证明当 Pi = l / n,i = 1 , 2 , ■ , nW , H { X ) 
达到极大值，计算此时 H { X ) 的值. 

14. 某人连续掷两枚均匀敢子，令 


X = 


1若其点数之和等于6 
0,其他 


令 y 为第一次掷骰子所得到的点数，计算 （ a ) H ( Y ), (b) Hy ( X ), (c) H ( X , Y ). 

15. 一枚硬币，抛掷时正面朝上的概率为 p -2/3, 现连续抛掷6次,计算试验结果的熵. 

16. 一个随机变童可取 n 个值: n ，…， ; r „ ，相应的概率值为 〆 *<),<= 1,2,…， n . 我们希望 
问-系列问题,每次只回答“是”或“否”，例如“是否 X = n ? ”或“是否 X 取或 
*3 之一个？” ,等等，为了得到 X 的值，你对平均问问题的次数有什么结论？ 

17. 对任何离散随机变量 X 和函数/,推出 H ( f ( X )) < H ( X ). 

18. 设 A •是在 A 端发送的0 - 1信号, y 为 B 端接收的信号, H ( X )- HyW 称为传输串.作 
为 P{X = 1} = 1 - P{X = 0} 的函数，当传输率达到最大时，这个值称为传输通道的容量. 
现设通道是个二进对称通道，即通道满足 P{Y = 1 |X = 1} = P{Y = 0 \X = 0} = p . 
证明，当 P{X = 1} = 1/2时，传输率达到*人值1 + plog 2 p+(l - p ) log 2 (l - p ) (这个 

最大值就是通道的容量〉. 


自检习题 

1. —个泊松过程，平均每小时发生3个亊件. 

( a ) 在早晨8:00〜10:00之间没有事件发生的概率是多少？ 

( b ) 在早展 8:00 〜 10:00之间发生的亊件数的期望值是多少？ 

( c ) 在下午2:00以后，第5个亊件发生的期望时间是多少？ 

2. 某-•个零售店的客流情况是这 样的： 顾客按泊松过程规律到达商店，速率为 A (人/每少 
时).己知在开门的第-个小时内有两个顾客到达，求下列亊件的 概率： 

( a ) 两个人都在前20分钟内 到达； （ b ) 至少有一个人在30分钟以前到达. 

3. 在路上，每5辆卡车中有4辆后面理一辆小汽车，每6辆小汽车后面跟一辆 卡车. 问在 
路上卡车所占比例有多大？ 

4. 某镇的天气分成晴、雨、阴.如果当天下雨，那么第二天要么是晴天，要么是阴天，两者具 
有相同的可能性.如果当天不下兩，那么以1/3的概率在下一天会维持原状.如果第二天 
气候改变的话，它会等可能地变到另外两种状态 之一. 从长期来看，晴天的比例有多大？ 
雨天的比例有多大？ 

5. 设； f 可取5个值，其相应概率为 0.35,0.2,0.2,0.2,0.05. Y 也可取5个值，其概率分别 
为 0.05,0.35,0.1,0.15,0.35. 

( a ) 指出 H [ X )> H ( yy , ( b ) 利用理论习题13,给出 H ( X ) > H ( Y ) 的直观解释. 
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引理 4.1 设 A ： 的取值范围为幻,…，;^.为了把它们编成长度为 ru ,.. 的 
0-1 序列（不能让其中一个序列为另-个序列的延长)，充要条件为 


证明： 为了证明引理，我们再强调-•些 概念： 编码系统就是某些长度可不一样的0 - 1序 
列的有限集合，这个集合必须满足两个 条件： 集合的各元索必须是互不相同的 0 - 1序列，并 
且任意一个元素（即0 - 1序列）都不是另一元索的延长.编码系统的元索（即0 - 1序列）称 
为码，以区别于系统外的 0-1 序列.编码系统的码的个数 N 称为系统的大小.每一个码 （BP 
0-1 序列）的长度称为码长.编码系统的各码的码长形成一个集合 { m , -- , n w }, 对于码长 
的集合，可定义叫= { ni , -- 中〜< 的个数，即职为编码系统中码长为 i 的码的个 
数.现在先证明，对于一个编码系统，其相应的满足 

«>„ < 2 n - wj 2 n_1 - iu „- i 2, n = 1，2,… (4.3) 

事实上 , Wl < 2 (n = 1) 是十分明显的，因为长度为1的0 _ 1序列一共有2个.故编码系统中 
码长为1的个数不超过2.对于 r » = 2,长度为2的0 - 1序列的个数为2 2 ,其中有 X 2个 


①本书中文版和英文影印版均己由人民邮电出版社出版.——编者注 
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为码长为1的码的延长，这些长度为2的 0- 1序列就不能作为码了.因此, w ^ 2 2 - Wi x 2 , 
即 (4.3) 对 n = 2成立.如此继续下去，可得 (4.3) 对一切 n 成立. 

将 (4.3) 改写成 


w n + Wn - i2 + • • • + tui2 n_, < 2 n n = 1，2, •.. 

两边除以 2", (4.3) 就变成 

(|)、1 对一切 n 成立 (4.4) 

^=1 

由于 n 为任意的，容易看出，这个条件变成 

i-i 

由于 W 是 ni , …， nAf 中等于的个败 

现 在设久 的取值范围为 XI ,••- , x N . 若把它编成码长为 n ,, ••- , n N 的编码系统，即 
{ X ,,--- ,1^} 与编码系统中的码建立了 --对应关系.根据刚才的讨论知，关系式 





必定成立.这就是引理的必要性. 

现在证明充分性.设 { n ,, - - , n w } 为一个正整数序列，满足条件 



我们指出必定存在一个大小为 iV 的编码系统，使得相应的码长之集合为 { ru ,. .. , n w } .我们 
还采用必要性证明中的记号多 1. 这样，充分性条件中的不等式变成 

J=> ' 7 

由上式可推知奶 < 2, 可取 m 个长度为 1 的码.在不等式中取 2 项，可得 W 2 ^ 2 2 ~ 2 w u 
这说明在长度为 2 的 0 - 1 序列中，最多有 2 3 - 2 助 个 0 - 1 序列，这些长度为 2 的 0 - 1 
序列和原来的长度为1的码放在-起形成一个编码系统.由于 wa < 2 2 - 2 Wl ， 显然可以选择 
W 2 个长度为2的0 - 1序列使得一共奶+ w 2 个0 - 1序列成为一个大 小为奶 +奶的编 
码系统.依次类推，可以选出+ W 2 + w 3 + ... 个0_ 1序列，形成一个编码系统.将这些码 
的长度列出来就是集合 {m.na, - - ,n w }. 有了这个编码系统，就可以建立 { 幻 , . . . 与编 
码系统的对应关系而完成编码任务. 口 



第 10 章模 拟 

10.1 引 言 


怎样确定单人纸牌游戏的胜出概率？所谓单人纸牌游戏就是用某种固定的方 
法玩5 2 张牌,一副牌的顺序确定以后,玩牌人的胜负就完全确定.一种合理的假设 
是一副牌的 (52)! 种可能的顺序是等可能的，然后数一数有多少种顺序会胜出，最 
后计算胜出的概率.然而这种方法显然不现实，因为 (52)! 种顺序是相当大的数量. 
而且即使一副牌的顺序已知，也只有按规则玩牌以后才能知道玩牌人是否胜出. 

看起来，确定一副纸牌的胜出的概率是数学的难题.然而，在应用科学中，试验 
是非常有价值的技术，对于单人纸牌游戏，试验就是玩一次牌，或者可以编制一个 
计算计程序，让机器去 玩牌. 经过几次玩牌以后，比如 ri 次，令 



此时；= 1,2,... , n 是独立的伯努利随机变童， 

E [ X * j = P { 第 i 次玩牌胜出 } 

由强大数定律 

贏的次数 
玩牌总次数 

以概率为1地收敛到单人纸牌游戏中玩家贏}.玩大量次数的纸牌游戏以后， 
贏牌的频率的就作为贏的概率的估计值.用试验的方法来确定概率值的方法称为 
模拟. 

为了使计算机实现模拟，我们必须产生 (0,1) 上均匀分布的随机变量的值，这 
些值称为随机数.大部分计算机有一内置程序，称为随机数发生器，它产生一个伪 
随机数序列.这个伪随机数序列无法与 (0,1) 均匀随机数序列区别开来.大部分随 
机数是这样产生的，它有一个初始值知，称为种子，以及正数 a , c , m , 然后令 
X n+ i = ( aX n + c ) modulo m n ^ 0 

上述记号表示将 + c 除以 m , 取其余数，得到下一个数 X n +1 . 这样，每个 
是0,1,… ， m - 1之一, X n / m 近似地在 （0,1) 上均勻分布.可以指出，适当地选择 
a , c , m , 可以产生一个序列，它就好像 (0,1) 区间上的均匀随机变量序列. 



开始模拟时，我们假定能够模拟 (0,1) 上均匀分布的随机变量，并用随机数序 
列这一术语表示 (0,1) 上均匀分布的随机变量的一组样本 • 

在单人纸牌游戏的例子中，我们先给出一个52张牌的一个顺序，然后让计算 
机去玩牌，然而顺序的抽取必须是 （52)! 种顺序中等可能地 取出. 因此，我们必须 
产生一个随机的排列.下面的程序指出怎样利用随机数产生一个随机样列,其方法 
如下，先从 n 个对象中随机地选定一个对象，将这个选定的对象放在 n 这个位置 
上，再在剩下 n - 1个对象中随机选出一个对象放在 （n - 1) 这个位置上,最后所有 
的对象都放在相应的位置上，一个随机排列就产生了.怎样从若干个对象中随机地 
选定一个对象？其方法是将这些对象样成一个任意的顺序，再利用随机数确定这个 
顺序中的一个位置，在这个位置上的对象就是随机地确定的对象. 

例 la (产生一随机排列）假设我们要将对象1,2,…， n 做成一个排列，使得 
所有 n ! 种排列都是等可能地成为选中的 排列. 从任一初始排列开始，经过 》1 - 1 
步，可产生一个随机排列，而每一步将其中两个对象交换一下位置，在整个过程中， 
我们用 X ( t ) 表示在位置 i 上的对象.其算法 如下. 

1 . 考虑一个初始排列， X ( i ) 表示在位置 i 上的对象.[例如，令 X ( i ) = i,i = 

!.•••)«•] 

2 . 产生一个随机变量乂, 是数集 { l ,2 ,--, n } 上的均匀随机变量. 

3. 将 X ( N „) 与 X ( n ) 交换位置，交换以后， X ( n ) 就是原来的 X ( N n ), 并且将 
这个对象固定在位置 n . [例如 ， n = 4,初始状态 X ( i ) = i , i = 1,2,3,4, 若 JV 4 = 3, 
此时，新的排列成为 X ( l ) = 1, X (2) = 2， X (3) = 4, X (4) = 3 •而 3 这个对象此后不 
改位置，永远放在位置4上 .] 

4. 产生随机数，它均匀地分布在整数集 { l ,2,. ., n - l } 上. 

5. 交换与 X(n - 1) 的位置•[若的=1,新的排列变成义⑴= 
4, X (2) = 2, X (3) = 1, X (4) = 3.] 

6 . 产生 N n .2, 它是取值于 {1,2, …， n -2} 的均匀随机变量. 

7. 交换和 X(n = 2) .[若爪=1，此时新的排列成为 X ( l ) = 
2， X (2) = 4， X (3) = 1， X (4) = 3.] 

8 . 产生 7 V „_3, …，直到爪产生,然后将 X ( N 2 ) 与 A ■⑺交换位置,得到最后 
的排列. 

执行这个算法，必须产生 {1,2, …， fc } 上等可能地取值的随机变量，其方法如 
下，取一个随机数 J7 , 即 f / 的分布为 （0,1) 上均匀分布. 注惫 kU 为 (0, fc ) 上均匀 
分布.因此 

P { t - 1 < ifct / < i } = ^ t = ,k 

取 AT fc = [ W /] + 1, 其中记号[: r ] 表示 o : 的整数部分，即不超过 a ; 的最大整数，则凡 
就会在 {1, …， fc } 上均匀 分布. 最后，我们可把算法简明地写成下列 几条： 
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第1步令 X ( l )， …， X ( n ) 为1,2,… ， n 的任意排列.[例如， X ( i ) = i,i = 
l ，-..， n .】 

第 2 步令 J = n . 

第 3 步产生一个随机数 t /, 令+ 1. 

第4步交换与 X { I ) 的位置. 

第5步将 J 的值减去1,如果 J > 1，则转向第3步. 

第6步 X ( l ),---, A -( n ) 就是随机排列 • 

上述产生的随机排列是十分有用的.例如，一个统计工作者希望比较 m 种不 
同的处理的效应,试验对象共 ri 个，他决定将 n 个对象分成 m 个不同的组，每一 
个组含叫个对象，显然 =«• 对于第 i 个组施以处理 i , 为了淸除任何偏 
向，（例如，若把最好的个体放在同一组，就会将处理的效果和个体的“好坏”作用 
相混淆，造成偏差.丨我们必须将各个个体随机地分入各组.怎样做才能完成这个 
任务? ® 

—个简单而有效的方法是将对象编号，由1号到„号,同时,产生一个1,2 ,…， n 
的随机排列 X ( l ),-.- , X ( n ), 将编号为 X ( l ),--- , X ( m ) 的对象归入第一组，将编号 
X(m + 1), ••- , X ( m + n 2 ) 编为第二组,一般地，将编号为义 ㈨ +… +71 W + fc),fc = 
1, •.. 的对象编成第:; 组, 然后对于第 j 组施行第:/种处理. ■ 

10.2 具有连续分布 函数的 随机变 置的模 拟技术 

本节中，我们提供两种模拟随机变量的一般方法，而这些随机变量具有连续分 
布函数. 


10 .2.1 反变换方法 

基于下列命题，我们可用反变换方法模拟具有连续分布函数的随机变量 • 


命题 2.1 设为（0, 1) 上均匀随机变量， f 为任意一个连续分布函数，定 


义随机变量 


Y = F -\ U ) 


则 y 具有分布函数 F . [ F - 1 ⑷是方程 F { y ) = x 的解 • 1 


〜⑷= P{Y < o } = P { F ~ l { U ) < a } 


(2.1) 


①对于 m = 2, 第 6 章例 2g 提供了另一种随机分组方法.本处介绍的方法比较快，但需要更多的 
存储空间. 
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由于 F ( x ) 是一个单调函数， F -^ U ) < a 成立的充要条件是 C / < F ( a ). 因此, 
由 （2.1) 式可得 


F Y (a) = P{U4 ： F(a)} = F(a) 口 

由命题 2.1, 我们首先产生一个随机数£/,然后令 X = F-\U), 可知 X 具有 
连续分布函数 F ( x ). 

例 2a (模拟一个指数随机变量）设 F ( ar ) = 1 - e_*, 则 F" 1 ^) 是下列方程的 
解：1 — e _s = tt 或 a ; = — ln(l - u ) 

因此，若 y 为 (0,1) 均匀随机变量，则 


F ~ 1 (^) = - ln ( l - J 7) 


的分布为指数分布，期望为 1. 由于 （1 - U) 也是 (0,1) 均勻随机变量， - hit/ 也是 
指数随机变量，其期望为1 .若久 具有指数分布，其期望为1 ,则具有指数分 
布,其期望为 c. 利用指数分布的这个特点知 -clnf ； 具有指数分布，期望为 c. ■ 
例 2 a 的结果也可以用来模拟 r 随机变董. 

例 2 b (模拟一个 r ( n ， A ) 随机变量） 

当 n 为整数时，我们可利用 r 随机变量与指数随机变置的关系模拟 r ( n , A ) 随 
机变量， r ( n , A ) 随机变量是 n 个相互独立同分布的指数随机变量的和，每个和项具 
有期望 1/ A . 因此，设％,•••,!/„为随机数（独立同分布的 (0,1) 均匀随机变量)，则 

X = -j2l^ i = -\ln^f[U^ 

具有 r ( n , A ) 分布. ■ 


10 .2.2 舍取法 

假定我们有办法模拟一个随机变童，其密度函数为％我们可以以这个随机变 
最为基础，模拟一个密度为/的随机变量.其方 法是； 先模拟一个随机变量广 y 
的分布密度为然后以正比于 f ( Y )/ g { Y ) 的概率采用 y 的值.具体说来，令 c 为 
一常数，满足 

对一切 j / 成立. 

a(y) 

然后采用下列步骤产生具有密度/的随机变量. 

第1 步模拟广使 y 具有 密度仏 同时产生一随机数 c /. 

第2步若 u < /( y )/ ㈣ ( y ) j , 则 x = Y , 否则回到第一步. 

舍取法模拟流程见图 10.1. 
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开始 




:x 为由舍取法产生的随机变童，记； V 为舍取法中循环的次数，则 


P{x <x} = P{Y n ^x} = p{y < x\U ^ 


P { Y ^ x , U ^- 


其中 A： = P{U^ f{Y)/[cg(Y)}}. 由于 y 与 t/ 相互独立， y 与 c/ 的联合密度 
由下式 给出： 

/(y,«) = s(y) o<u<i 


P{x <x} = 士 JJ g(y)dudy 


»<* 

0<u</(v)/c«(v) 

/•* /*/(»)/ c 9(») 


f{y)dy (2.2) 


由于 /(y) 为密度函数，上式两边令 : r -» +oo, 得 


这样， （2.2) 式变成 


P{X <i}= / f(y)dy 


注释⑷前面提到以概率 f(Y)/[cg(Y)} gfS ^是指产生一个随机数 t；, 若 
f{Y)/ [cg(X )], 则令 X = y. 

(b) 在产生随机数的过程中，接收的概率为 f{Y)/[cg{Y))} = K = 
1/c. 由此可知，循环次数 iV 的分布是以 c 为期望的几何 分布. _ 

例 2c (模拟一个正态随机变 ft) 

设 Z 是一个标准正态随机变童（期望为0,方差为 1) •注意 A： = |Z| 具有密度 








函数 
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/(*) = ^= e _lS/2 0 < I < 00 (2.3) 

开始时，我们先用舍取法,模拟 X . 取一个 密度函数 〆 ： c ) 
g ( x ) = e~ x 0 < a : < 00 

注意到 

= y | exp {^^ j < v /| (2-4) 

取 c = v / SiTS , 由 （2.4) 式知 

现在，我们可以用舍取法模拟；^ 

( a ) 产生独立随机变量 F 和 K 其中 y 具有期望为 1 的指数分布，1/为 (0,1) 
上均勻分布. 

( b ) 若 exp {-( y - 1)2/2} ，則 X = y , 否则转向 （ a ). 

当 X 得到以后[ X 具有密度 (2.3)], 可令 Z = + A •或 - A •，以1/2的概率取正 
号，1/2的概率取负号. 

在步骤 （ b ) 中，条件 t ； 矣 exp {-( y - 1) 2 /2}等价于 -In 1/彡 （y - 1) 2 /2 ,但是 
在例 2 a 中指出， - In 卩是指数随机变量，期望为1，因此，步骤 ( a ),( b ) 等 价于： 

( aO 产生两个相互独立的，期望为1的指数随机变董 K 和 y 2 . 

( bo 若 r 3 > ( y ! -1) 2 /2, 令 x = Yi ， 否则转向 （ a '). 

当 vi 被接受时， y 2 必大于 （yi -1) 2 /2, 但是 n 比 （yi - i ) a /2 大多少？利用 
指数分布的无记忆性，当 y 2 值超过某值时，超过部分的时间是一个均值为1的指 
数随机变量，因此, y 2 - (k -1) 2 /2 也是指数分布随机变量，其均值为 1. 这样，在 
得到久的同时，我们也能得到另一个指数随机变量 y 2 - - l ) a /2, 它与 x 相互 

独立，并且期望为 1. 这样,在模拟标准正态随机变量时，我们还附加地产生一个指 
数随机变量. 

综合起来，我们可以利用下列步骤产生一个指数随机变量（期望为 1) 和与之 
独立的标准正态随机变量. 

第1步产生 K ， 指数随机变量，期望为 1. 

第2 步产生 K ， 指数随机变量，期望为 1. 

第3步若 y 2 — ⑺ -1)2/2 > 0,令 y = y 2 - (Vj - 1) 2 /2,转向第4步，否则转 
向第一步. 
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第 4步产生一个随机数 y , 令 

~Yi U > 1 - 

上述过程所得到的 y 与 z 相互独立, z 为标准正态随机变量， f 为指数随机变童， 
期望为 1( 若要求得正态随机变量，其期望为方差为^只需取 /i + ffZ .). 

注释 （ a ) 由于 c = » 1.32, 在前述的产生随机变量过程中，第3步中 

要求有 iV 步的循环,其中 iV 是均值 C » 1.32 的几何随机变量. 

( b ) 若我们希望产生一个标准正态的随机变童序列，则在第3步中生产的 V 可 
供产生下一个正态随机变量 之用. 这样算来，产生一个正态随机变量需要 1.64(= 
2 x 1.32-1) 个指数随机变量以及 1.32 次平方 运算. ■ 

例 2 d (模拟正态随机变量——极坐标法）在第6章例 7 b 中指出，若为 
相互独立的标准正态随机变量,则它们的极坐标/? = VX ^ + Y ^ 和 e = arctan ( y / X ) 
相互独立， fl 2 为均值2的指数随机变量 . e 在 （0,2 ji ) 上均匀分布，因此，若取 
C 4 ，的为随机数（利用例 2 a 的方法生成)，我们得到 

R ={-1\ nU l ) 1/2 0 = 2 jiC/ 2 

从而 

X = RcosQ = (― 21 nt / i)i cos (2 ji £/2) Y = RsinQ = (—21 nC / i)i sin (2 n [/2) (2-5) 

_ 

上面提供的产生标准正态随机变量的 
方法称为 Box - Muller 方法，由于需要计算 
8 in 6 与 cos 0, 其效率受到质疑，但是可用 
下面方法避免费时的困难，由于 P 为 (0,1) 
均匀随机变量，21/为 (0,2) 均匀随机变量， 
所以21/ - 1是（-1，+1)上的均匀随机变 
景. 设为两个随机数，令 

V \ = 2 Ui — 1 V2 = 21^2 — 1 
则 ( Vi . Va ) 是在面积为4,中心为(0,0)的 
—个方块上均匀分布的随机向量. 

我们假定连续产生 ( Vi , V 2 ), 直到产生一对 ( V !, V 2 ) 满足条件 V ? + V ? < 1,即 
( Vi , y 2 ) 处于以 (0,0) 为中心的单位圆内（见图 10.2), 显然这样得到的 （ Vi ， v 2 ) 是在 
单位圆内均勻分布的随机向量. 取(成❺）为的极坐标.容易验证 K 与❽相 


为独立的标准正态随机变量. 
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互独立，炉为 (0,1) 均匀随机变置，❺为 （0,2)1) 上均匀随机变童（见习题 13). 由于 


sin© = -^ 



COS0 


% 

R 


Vi 


由 （2.5) 式知，标准正态随机变量可从下式得到， 


X = (-2\aU) l/2 Vi/R Y = (-2]nU) 1/2 V 2 /R 
事实上，由于（在叶+ V 2 2 < 1的条件下)护为 （0,1) 均匀随机变量，与0独立，这 
样，及 2 可代替而不必重新产生新的随机数. 

为相互独立的标准正态随机变置，其中 

s = r 2 = v^ + vi 

综合起来，利用下列方法可以产生一对独立的标准正态随机变量_ 

第1步产生随机数 

第2步令 Vi = 2 R _ 1, V 2 = 2的 -1 ，S = V ? + V 2 2 ; 

第3步若 S >1, 转向第1 步； 

第4步得到独立的标准正态随机变量 

x= y= 

上面的方法称为极坐标法，由于在正方形中随机点落入单位圆内的概率为 Ji /4 
(圆面积与正方形面积之比)，平均来说要经过 4 /ji « 1.273 次循环产生2个相互独 
立的标准正态随机 变童. 因此，平均来说要求 2.546 个随机数，一次求对数，一次求 
平方根，一次除法， 4.546 次乘法才能求得两个相互独立的正态随机数. 

例 2 e (模拟一个 X 2 随机变量） n 个自由度的 X 2 分布就是随机变貴；^ = 
zi + .-.+ zl 的分布，其中 A ，…， Z „ 是独立标准正态分布的随机变量序列，在第 
6章 6.3 节指出， Z ? + Z | 具有指数分布，期望为2,因此当 n 为偶数时,例如 n = 2 fc , 
则 xL 的分布为 r 分布，参数为 ( fc , l /2). 

这样, -2 lnOlU ^ i ) 具有狄个自由度的 X 2 分布，当 n = 2 fc +1为奇数时，我 
们只需先求出一个标准正态随机变量 A 再将 Z 2 加到可得到狄+ 1个自由 
度的 X 2 随机变量，即 

xL + ,=^-21 n ( n ^) 

«=i 

其中 Z , Ui ,- - , Uk 相互独立， Ui , ■■- , u k 为随机数序列， z 为标准正态随机变量_ ■ 
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10.3 模拟离散分布 

模拟具有连续分布函数的随机变量所使用的方法，都可适用于离散随机变量的 
模拟.例如，我们希望模拟具有下列分布列的随机变量 X : 

P{X = Xj} = Pj j = 0,1, • ■ • , Pj = 1 

可利用下面的方法,它是反变换方法的离散版本. 

设 C / 为随机数，令 

11 若 U 《 P ' 

12 若/ *1 < £/ < + 尸2 

x= ■■- 

Xj 若 , 乞忾<11 

i=l i=l 

由于 

P { X = } = P j £ < 1/ < X ； Pi} = ^ 

lt=l i=X ) 

我们可以看出，所产生的随机变量； f 具有离散分布列 { P it j = 1,2,- ■■}■ 

例 3 a (几何分布）设有一独立重复试验，每次成功的概率为 p ,0 < p < 1，试 
验一直到出现成功为止，记 X 为试验的次数，则 

P{X = i } = ( l - p) i - 1 p 1 

X = i 表示前 i - 1次试验的均为失败，而第 i 次成功.随机变量 X 的分布是参数 
为 P 的几何分布.由于 
j-i 

53 p { x = 0 = i - > j -1} 

»=i 

=i - p { frj - 1 次试验均为失败 } = 1 - (1 -py- 1 j>i 
这样, X 可以由下列方式产 生：取 [/ 为随机数[即 （0,1) 上均匀随机变量，下同 ] ， 
当 

1 - (1-p )^- 1 <u ^i-(i-py 

时, x 取为 j , 上式与 

( l - p )^ l - C ^<( l - p ) J '- 1 

是等价的，又由于 U 与 1- U 具有相同的分布，因此, X 具有下面的表达式 
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X = min{j : (1 - p) j < £/} = min{j : jln(l - p ) ^ In 17} = min : j ^ 

上式中有一个不等号反向的过程，其原因是, ln ( l - p)<lnl = 0, 用这个数去除不等 
号的两边时，不等号应反向.利用记号 [ x ]([ i ] 为不 超过; r 的最大整数)，久可以写 
成 

x - 1+ [s^rt] ■ 

和连续情形类似，对于某些离散分布，也开发出某些模拟方法.现举出其中2 
个方法. 

例 3b (模拟一个二项随机变量）二项随机变量[参数为 ( n , p )] 可以表示 n 个 
独立的伯努利随机变童之和，利用这一点，很容易进行模拟，设 t/v ,【/„为一组 
随机数，令 



易知 X 三是二项随机变量，其参数为 ( n , p ). ■ 

例 3 c (棋拟 一 ^泊松随机变量）设…为一串随机数，记 AT = min{n : 
nr_i Ui < e - A }, 我们将指出随机变量 X = N - 1 具有泊松分布，其期望为 A . 注 

X + 1 = min {n : JJ C /< < e _A } 

t=l 

与 n 0 

X = max {n : J"J t /< 其中 f /» = 1 

«=i <=i 

是等价的.上式经过化简得 

X = max |n : ^ In Ui ^ — a | = max |n : ^ — lnt/j ^ a | 

注意到 - InK 具有指数分布，其期望值为 1. 现在考虑一个泊松过程,其速率为1, 
易知，这个过程在 (0, A ) 上事件的个数的分布为泊松分布，其期望为 A , 而 （0, A ) 上 
每两个相邻事件之间的时间间隔刚好为参数为1的指数分布，而且这些时间间隔 
又相互独立.现在再看一看久的表达式,其分布刚好与泊松过程在 （0， Aj 上事件的 
个数的分布 相同. 因此， X 的分布为泊松分布，其期望为 A . ■ 

10.4 方差缩减技术 

设 Xi ，…， x „ 具有一己知的联合分布,现在我们希望计算 
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，■-- , X n )) 

其中 3 是一个已知的函数，有时候要解析地计算这个值是十分困难的.但我们可以 
利用模拟技术去估计0的值•我们可以产生一组，^ 1 )，使得 Xf 1 ) ，… , X ^ 
与 , X n 具有相同的联合分布，令 

Y 1 = g ( x [ 1 \..., X ^) 

同时，我们还可以模拟一组使得它与第一组变量相互独立并且具有 
相同的联合分布，令 

Y 2 = g ( X [ 2 \：., X ^) 

继续模拟下去,得到 yi , y 2 , …, Y k ( k 为事先确定)，相互独立，且与 
x n ) 分布相同，记 P 为 Yi ， …的平均数，即 

则 

E [ Y ) = 0 E[[y - 0) 2 ] = Var (?) 

由上式可知， f 的均方误差等于 F 的方差，我们希望 Var ( y ) 越小越好.[在我 
们所讨论的情况下, Var ( y ) = iVar ^), 而通常这个童是不知道的，我们必须设法 
从的值去估计它 . j 现在我们需要介绍几个方差缩减技术. 

10.4.1 利用对偶变置 

前面我们介绍估计0的方法时,假定所产生的 vi 与 y 2 相互独立且同分布.现 
在讨论关于方差的一个公式 

Var(^y^) = i[Var(n) + Var(y 2 ) + 2 Cov(yi,y 2 )] 

由上式可以看出,若 y \ 与 y 2 具有负相关，则从缩减方差的角度看,可将 i /2( k + 
y 2 ) 的方差压缩.现在看一看如何实现把方差 缩减. 先假定 x u …， x n 是相互独 
立的，此外，每一个变量都是利用反变换方法产生的，即 X * = F -\ Ui ), 其中认是 
随机数，6是兄的分布函数， V !可表示成 

Y 1= : giFr 1 ^), - - , F -\ U n )) 

由于1 - t / 也是 （0,1) 随机数，1 - t / 与£/具有负相关，若定义 
Y 2 = g ( F{-\l -%)，• ■， ^-'(1 - U n )) 

则 y 2 与 yi 同分布.因此，若 n . Vz 负相关，那么 ( y ,+ y a )/ 2 的方差就会比 | Var ⑺） 
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小.（另外，从计算的角度，也节省了计算童，在产生 y 2 的时候，本来应该产生 n 个 
新的随机数,现在可用1 - t^，i = 1,… ， n 代之 .） 在一般情况下,我们不能证明 H 
和 h 为负相关，但通常情况下，它们是负相关的，特别当 g 是单调函数时，可以证 
明它们是负相关的. 


10.4.2 利用“条件”缩减方差 

首先回忆下列条件方差公式（见 7.5.4 节)： 

Var ( y ) = f ；[ Var ( y | Z )] + Var ( B [ y | Z ]) 

现在假定我们要估计 ElgiXu ■■- , X n )], 先模拟 X = ( Xj , -- , X n ), 再计算 F = 
g ( X ), 但是，若存在某随机变量 Z, 并且能够计算 £[y|Z], 由于 Var(y|2) > 0, 利 
用条件方差公式得 

Var ( E [ y | Z ]) < Var ( K ) 

由于 E [ E [ Y \ Z ]\ = E \ y ] ,可知 E [ F|Zj 比 y 更好. 

例 4 a (估计 Jt ) 令 U U U 2 为随机数，记 K = 2认 - l,i = 1,2,在例 2 d 中己经 
指出 (V U V 2 ) 在面积为4,中心为 （0,0) 的一个方块内均匀分布，随机点 （ Vi , ⑹落 
在半径为1的以 (0,0) 为圆心的圆内的概率为 tc /4 (见图 10.2, ji /4 等于内接圆与 
正方形面积之比).现在可模拟 （ Vi , V 2 ) n 次，令 

1第 j 次模拟 落在单位圆内 
0其他 

故 lu - . ，1„ 为独立同分布 ， Elfjl = n /4, 利用强大数定律， 

h ±^± k ^ „-，oo 

n 4 

将这个比例乘以4,可得; t 的估计. 

利用条件期望可改善这个估计，对于示性函数 /. 考虑条件概率 
E [ I \ V !] = + V 2 a < m ) = P { V ? < 1 - V ^\ Vi } 

由于 

P { V ? < 1 - Vi 2 |Vi = v } = P { V ^ < l - w 3 } 

= P{-\/l — t ; 2 < V2 < \/l — v 2 } = 

即 E [ I \ Vi ] = y /1 - Vj 5 , 因此，利用 v /1 - 的平均值作为 Ji / 4 的估计是原来的估 

计的改进.又由于 

E [ yi - vf ] = j ' = 


J y/T--i^du = E 1 — t/ 2 J 
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其中 C / 为随机数，即（0，1)上均匀分布的随机变量，因此，我们模拟产生 n 个随机 
数，利用 的平均值作为 n /4 的估计，具有更高的精度（习题14指出，利用 
产生的估计与利用产生的估计具有相同的精度). 

由于是一个单调递减函数，我们可以利用对偶变量 
法，进一步减少估计的误差,我们可用 n /2 个 ( y / T ^ U ^ + VI - (1 - U ) 2 )/2 的平均 
值来估计 ji /4 ,下面的表列出了 n = 10 000时, n 的估计值. 


方 法 

K 的估计 

落入单位圆内随机点的比例 

3.1612 

■VI-u ^ 的平均值 

3.128448 

i(Vl - U 3 + U 3 )) 的平均值 

3.139578 


利用最后一个方法，当 n = 64 000时, jt 的估值为 3.143 288. 


10.4.3 控制变 ft 


假设我们希望模拟 E [ g ( X )) ，其中 JC = ( Xi ,---, X n ). 但是我们已知某 f { X ) 
的期望，例如 E [ f ( X )] = m , 我们可利用 

W = g ( X ) + a [ nX )- n ) 


来棋拟,但 

Var ( W 0 = Var [< ? ( A -)] + o 2 Var [/( X )] + 2 aCo V [ s ( X )，/( X)l 

在上式中令 


-Co V [/(X), g (X)] 

Var [/( X )] 


得 


Var ( W ) = Var [ g ( JI：)j - 


cov [/(. y ), g ( x )] 2 
Var [/( X )]~ 


(4-1) 

(4.2) 

(4-3) 


但是通常， Vaxi / POl 和 Cov [/( X ),<?( Jr )] 是未知的，因此，我们得不到所需的 
方差缩减.实践中，我们可以利用模拟数据去估计这 个值. 理论上我们可以利用这 
个方法对所有的模拟结果缩减相应的方差. 


小 结 


设 F 是一个连续的分布函数, [/是 (0,1) 上的均匀分布的随机变量（称为随机 
数）则 F ~\ U ) 具有分布 F ， 其中 F ->(«) 是方程 F { x ) = u 的解，这种由随机数构 
造其他随机变量的方法称为反变换方法. 

另一个产生随机变量的方法称为舍取法.假定对于密度3,我们已经有一个产 
生随机变量的成熟的方法，现在希望模拟一个具有密度/的随机 变童. 我们首先确 



定一个常数 c , 它满足 


题 411 


然后经过下列 步骤： 

第1步产生 y , 其密度为 
第2步产生随机数 t /. 

第3步若 C ； < f { Y )/{ cg ( y )}, 则令 X = Y , 过程中止 • 

第4步回到第1步.此方法循环的次数具有几何分布，其平均值为 c . 

标准正态随机变量可通过舍取法产生 （ S 为指数密度，期望为 1) 或者利用极坐 
标方法产生. 

为了估计某一个参数0,首先模拟一个随机变量，使得它的期望值为0,然后, 
利用统计方法缩减其相应的方差.本文中介绍了三种缩减方差的 方法： 

1. 利用对偶变量. 

2. 利用条件期望. 

3. 利用控制变量. 


习 题 

1. 下面的方法可能产生- - , n } 的-个随机排列.这个方法比例 la 中介绍的方法快, 
但是这个方法一直到计算结束，才把每个位置上的元索确定下来.此处 P ( i ) 表示位置 i 
上的元索. 

第1步令 fc = l . 

第2步令 P ( l ) = 1. 

第3步若 fc = n , 则停止，否则令 fc = fc + l . 

第4步产生一随机数令 

p(k) = p([fcr/] + 1) p([a ：^ + i) = fc 


回到第3步. 

( a ) 解释为什么这个方法行得通 • 

( b ) 指出在 fc 步，即 P ( k ) 确定以后， P ( l ), -- , P ( k ) 是1,2，." ， fc 的一个随机棑列. 
提示： 利用归纳法，并且指出 

= ^ j - 利用归纳法 

2. 模拟一个随机变量具有下列 密度： 


/⑻ 



—oo < x < 0 
0 < * < oo 
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3. 模拟一个随机变量具有下列 密度： 


/(x) = 


- 2) 2<x^3 

K 2 -f) 3 〈… 

0 其他 


4. 找出-•个棋拟具有下列分布函数的随机变量的 方法： 





x< -3 
-3 < x < 0 
0<i^4 
* > 4 


5. 利用反变换产生一个威布尔分布的随机变童，威布尔分布的分布函数由下式 给出： 
F(i) = 1 - e~ atB t > 0 


6. 给出一个棋拟具有下面失效率函数的随机 变量： 

(a) A ⑴= c; (b ) 入⑷ = ct ; ( c ) 入⑴ = ct 2 ; ( d ) 久⑴ = rf 3 . 
T . 设 F 是一个分布函数 

F ( x ) =* n 0 < * < 1 

(a) 只利用一个随机数，给出一个棋拟此分布的方法 • 

(b) 记仍，…，1/„为独立随机数，指出 

P{max(t/i , • ■ • , t/ n } <*}=*" 

(c) 利用 （b), 给出一个棋拟 f 的方法 • 

8. 假定模拟 Fi,i = l , --, n 是比较容易的，如何棋拟下列分布函数？ 
(a) f { X ) = nr=i f ‘ ⑻ . (b) f(*) = i - n?=i(i - 綱 . 

9. 假定我们有一个方法模 拟朽和 ft, 如何模拟 


F(x) = pFi ( x ) + (1 — p)Fa(*) 0 < p < 1 


给出一个模拟下列分布的 方法: 


f|(l-e- te ) + |* 0<x<l 
1 I(l_ e -3*)+? *>1 


10 .在例 2 c 中,利用舍取法模拟标准正态随机变量时利用了指数分布 （A = 1，期望为士 = 1). 
现在的问 题是： 是否可以利用其他的指数密度，达到更高的效率，例如利用密度= 
Ae- A *, *>0. 指出平均循环次数当 A = 1时达到 最小. 
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11. 利用舍取法, = l ,0< i < l , 求一个棋拟下列分布的 算法: 


12. 怎样利用随机数去通近 



0 < a : < 1 

其他 


/o fc ( x)dx ,其中 k ( x ) 是任一函数？ 


提 示：若 U 是随机数， B [ Jk ( l /)] 是什么？ 

13. 设 ( X , y ) 为以 (0,0) 为圆心，半径为1的圆上均匀分布，它的密度为 

/(*， y) = ^ 0 < * a + i/ a < 1 

记月=+ y a ) 1/2 和0 = arctan ( y / X ) 表示它的极坐标.指出与0相互独立, 
为 (0,1) 上均匀随机变量，0为 (0,2 n ) 上均匀随机变量. 

14. 在例 4 a 中，我们己措出 • 

五[(1 一 V a ) ,/a ] = E[(l - 1; 2 ) 1 / 2 ] = 5 
其中 V 在 (-1,1) 上均匀分布， 而 U 在 (0,1) 上均匀分布，指出 


R 2 


Var[(l - V a ) 1/a ] = Vax[(l - U 2 ) 1 ' 2 ) 

15. ( a ) 验证： 当 a 由 (4.2) 给出时， (4.1) 达到极小值. 

( b ) 验证 (4.1) 的极小值由 (4.3) 给出. 

16 . 设； f 取值于 （0,1), 其密度为 /( I ). 指出棋拟 9( X )/ nX ) 可以估计以 g ( x ) dx . 这个方 
法称为重要样本法，其要点是选择/与9相似，使得 9( X )/ f ( X ) 具有较小的方差. 


自检习题 

1. 设 X 具有概率密度 

/(*) = Ce x 0< x < 1 
( a ) 找出常数 C 7; ( b ) 指出棋拟； C 的方法. 

2. 找出一个模拟随机变量的方法，该随机变置具有密度 

/(*) = 30( x 2 -2x 3 +x 4 ) 0 < z < 1 

3. 找出一个棋拟离散随机变量的有效算法，其分布列为 

pi = 0.15 pa = 0.2 P 3 — 0.35 p < = 0.30 

4. 设 X 是一个正态随机变量，其期望为方差为定义一随机变量 V ,使它与 A •具 
有相同的分布，但是负相关. 

5. 设 x ， y 具有独立指数随机变量，其期望为 1. 

( a ) 利用棋拟方法找出估计 E [ e XY ] 的方法 • 

( b ) 利用一个控制变量将 （ a ) 中得到的估计改进 • 
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弱大数律，354, 365 

S 

三角分布，230 
舍取法，401, 458 
亊件，1, 79, 447 
斯蒂尔切斯积分，331, 332 
随机变•，108, 332, 456 
随机变童函数的分布，197 
随机个数随机变量之和的期望，303 
随机徘徊，279 
随机样本极差的分布，246 
随机游动，382 

T 

条件独立，86, 100 
条件方差，313, 409,455 
条件概率，54, 90, 409 
条件期望，300, 341, 450 
条件协方差公式，345 
推广的计数基本法则，2, 16 
W 

威布尔分布，195, 207, 412 
威布尔随机变量，195, 207 
危险率，192, 210 
韦思图，23, 27 
无记忆的，189, 226, 435 
舰忆性，190, 403 

X 

先验, 87, 243, 317 
相关系数，242, 305, 343 
相依，132, 294 
相依的，71，219 
效用，119, 371 
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Y 

样本均值，274, 329, 365 
样本空间，21, 43, 147 
优惠券的收集问题，277 
优惠券收集问题，286, 290 
游程的期望数，278 
有放回抽样，47 
预测，21, 318, 347 

Z 

詹生不等式, 370, 371 
正态分布，180, 243, 405 
IF . 态随机变童，180, 327 
指数，155, 250, 436 
指数分布，188, 264, 454 
指数随机变最，188, 248, 404 
中心极限定理，181, 359, 375 


重心，116, 121 
主观概率, 43 
转移概率矩阵，381, 394 
组合，1, 19, 443 
组合分析，1, 8, 20 
最优奖问题，311 
棣莫弗拉普拉斯极限定理，185 
其 他 

r 函数，193 
r 分布，193 
P 分布，196 
C 分布，146 
Box-MuUer 方法, 404 
Poisson 随机变量，128 
Zipf 分布，146 



